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Verfahren zur Herstellung mehrfach ungesSttigter Fetlsauren 
Beschreibung 

?® vorliegende Erfindung betrifft ein Verfahren zur HersteHung von mehrfach ungesat- 
tigten Fetlsauren in einem Organismus indem Nukleinsauren in den Organismus ein- 
gebracht werden, die fQr Polypeptide mit Acyl-CoA:LysophosphoIipid-AcyItrans- 
feraseaktivitat codieren. Vorteilhaft konnen diese Nukleinsauresequenzen gegebenen- 
fails zusammen m,t weiteren Nukleinsauresequenzen. die fur Polypeptide der Biosyn- 
e^^fmlert '^P''^^^^^*^^'^ ^^"^ t^ansgenen OrganisrJlus 

«^h!l!rnHT ^t^^^'*®"-*^'" Nukleinsauresequenzen. NukieinsSurekonstrukte 
enftaltend die erfindungsgemaBen Nukleinsauresequenzen. Vektoren enthaltend die 
Nukleinsauresequenzen und/oder die Nukleinsaurekonstrukte sowie transgene Orga- 
unXdirJeSn vorgenanrrten Nukleinsauresequenzen. Nukleinsaurekonstrukte 

Bn welterer Tell der Erfindung betrlfft Ole. Uplde und/oder Fetlsauren hergestellt nach 
dem erfindungsgemaBen Verfahren undderenVenwendung. -lemnacn 

T w™* I?9lyceride haben eine Vielzahl von Anwendungen in der Lebensmit- 
telindustne. der Tleremahrung, der Kosmetik und im Pharmabereich. Je nachdem ob 
n^ri^hZ^n ungesattigte Fettsauren Oder um Triglyceride mIt ei- 

nem erhohten Gehalt an ges^ttigten Oder ungesattigten Fettsauren handelt, sind sie fOr 
uno^^SliS'S^^^^^ /^wendungen geeignet. so werden beisplelswelse mehrfach 
ungesattigte Fettsauren Babynahrung zur ErhOhung des Nahnvertes zugesetzt . iVIehr- 
Sfl3fr.?l>^^^^^^ ""^ w-e-Fettsauren stellen dabel einen wichtigen 

l^^frnmflo^ ' H " """^ "lenschlichen Nahrung dar. Aufgrund der heute Qblichen 
t«n f Tel ^^""^ T menschlichen Nahrung ist ein Zusatz von mehrfach ungesattig- 
Shtf"^f "^T V-^ "T'^^* vorkommen. zur Nahrung besonders 
wichtig. So werden beispielsweise mehrfach ungesattigte Fettsauren wie Docosahi 
:irfS?fi tiA^J^' C22:6-^'^'^°----^^ Oder Eisosapentaensaure (= EPK 
C20:5 • > ^.^^) Babynahrung zur Erhohung des Nahm^ertes zugesetzt. Der unaesat- 

"^''^ ^''^'^ '^'^ Ent^cklung des Q^^s 

Im folgenden werden mehrfach ungesattigte Fettsauren ais PUFA, PUFAs LCPUFA 

^r:Ld'^;^^^^^^^ 

Hauptsachlich werden die verschiedenen Fettsauren und Triglyceride aus Mikroorga- 
rasm^n wie Mortierella oder Schizochytrium oder aus Ol-produzierenden Pflanzen wIe 
Soja. Raps. Algen wie Crypthecodinium oder Phaeodactylum und weiteren gewonnen 
wobe. sie ,n der Regel in Fomi ihrer Tnacylglycende (= Triglyceride = TriglyceZ) an 
fallen. Sie konnen aber auch aus Tieren wie z.B. Rschen gewonnen werdeTSe frefen 
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Fettsauren warden vorteilhaft durch Verseifunq heraesteiit Wfth^r^ moi,^ u 

tigte Fettsauren wie DHA. EPA. Araomon^^eTA^Tc^^^^^^ ""3^^^*- 

linolen^ure (C20:3-.-.-) oder DocosapentaensLure (dVT C2^^^^^^ 

Je nach Anwendungszweck sind 6te mit ges§ttiaten oder iinn«ea«i«t«r. c « - 

deninMedlkamenlenAnwenduna (ILF«^!l^T^^^''9egeben Oder fin- 
« •"ense.a^el«relnennega.SenESaufrei1^^ 

chidonsSure und der Bco^e^^^^^ ^' "'"omo-Y-Bnolensaure, der Ara- 
nen, die sloh von Zj^^^TZT^' Leukotrle- 
S noide (sog. PGrSeJe) ^ a?s^e^!Si ^"^"'''nsa^e ableiten, Elcosa- 

gennge oder kelne enUOndungs.S^.emS^^^J'h^^'" 

nem US-Aquivalent eine A-9-Desaturase beschri»h«n i„ lAf/Voo^ /J ""^ 

15-Desaturase in WO 84/1 1516 wiS . f ?f " ^^45 wird eine A- 

Desaturasen warden bS^rs^^^^^^^^^^ ^^TB^^TZ'n^T'''''''''- 

WO 97/21340. WO 95/18^f EP-H 79^2^ Stulfir? TJ^^^' 

1 990: 20144^20149 WadHi kV7 V., ' ""^^^ ®* "^'O'' ^hem., 265, 

, nen Desafcirasen 1st jedoch bisher ^SSuSnd S^r^".? cterverschlede- 
raijgelxindene ProteWe nursahr , ™ 7 Enzyme als memb- 
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anschlieBend auf Enzymaklivitat mittels Edukt- und Produktanalyse untereucht wfrxl A- 

93/06712, US 5.614.393, US5614393, WO 96/21022 
WOOQ/21557 und WO 99/271 1 1 beschrleben und auch die /Vnwendung zur Produktion 
. in transgenen Organismei> beschrleben wie in W098/46763 W098/46764 
W09846765. Dabei wird auch die Expression verschiedener Desaturasen'wie In 
W099/64616 Oder W098/46776 und Bildung polyungesattigter Fettsauren beschrleben 
und beansprucht Bzgl. der Effeklivltat der Expression von Desaturasen und Ihren Eln- 
. fluss auf die Bildung polyungesattigter FettsSuren ist anzumerKen. dass durch Expres- 
sion einer einzelnen Desaturase wie bisher beschrieben lediglich geringe Gehalte an 

und Stearidonsaure errelcht 
wurden. Weiterhin wurde in der Regal ein Gemisch aus oi-S- und oj-6-Fettsauren erhal- 

Besonders geeignete Mikroorganismen zur Herstellung von PUFAs sind IWikroorga- 
nismen Wie Thraustochytrien oder Schizochytrien-Stamme, Algen wie Phaeodactylum 
15 tncomulum Oder Crypthecodlnium-Arten. Ciliaten. wie Stylonychia oder Colpidium Pll- 
ze. wie Mortierelia. Entomophthora oder Mucor. Durch Stammselektion ist eine Anzahl 
von Mutantenstammen der entsprechenden Mikroorganismen entwickelt worden die 
eine Reihe wOnschenswerter Verblndungen. einschlleBlich PUFAs. produzleren Die 
Mutetion und Seiektlon von Stammen mit verbesserter Produktion eines bestimmten 
Molekuls wie den mehrtach ungesStBgten Fettsauren Ist jedoch ein zeltraubendes und 
schwienges Verfahren. Deshalb warden, wenn immer mdgllch wie oben beschrieben 
gentechnologische Verfahreri bevorzugt. Mit Hilfe der vorgenannten Mikroorganismen 
Isssen sich jedoch nur begrenzte Mengen der gewiinschten mehrfach ungesattigten 
Fetl^uren wie DPA. EPA oder ARA herstellen. Wobei diese in der Regel je nach ver- 
wendeten Mikrooiganismus als FettsSuregemische aus beispielsweise EPA. DPA und 
uriA dnmlien. 

i^lT!!"".!?"" '*ir'°''"'*°" ^" FeJnchemlkalien im groSen MaSstab vorteilhaft Qber 
die Produlrtion in Pflanzen durchgefOhrt werden, die so entwickelt werden. dass sle die 
vorstehend genannten PUFAs herstellen. Besonders gut fur diesen Zwed; geeignete 
Rin^«nn.« SroSe Mengen an Lipldverbindungen enthalL wie 

Raps Canola. Um. Soja, Sonnenblumen. Borretsch und Nachtkerze. Aber auch ande- 
re Nutzpflanzen. die Ole oder Uplde und Fettsauren enthalten. sind gut geeignet. wie in 
der eingehenden Beschrelbung dieser Erflndung enA,ahnt. MIttels herkSmmllcher ZQcl^. 
tung ist eine Reihe von Mutantenpf lanzen entwickelt worden. die ein Spektrum an 
wOnschenswerten Uplden und Fettsauren, Cofaktoren und Enzymen produzieren 
Die Selektion neuer Pflanzensorten mit verbesserter Produktion eines bestimmten Mo- 
lekuls ist jedoch em zeltaufwandiges und schwieriges Verfahren oder soger unmogllch 
wenn die Verbmdung in der entsprechenden Pflanze nicht naturlich vorkommt. wie im ' 
Fall von mehrfach ungesattigten C,b-. C^a-Fettsauren und C^a-Fettsauren und solchen 
mit langeren Kohlenstoffketten. 

Aufgrund der posWven Eigenschaften ungesattigter Fettsauren hat es In der Vergan- 
genheit nicht an Ansatzen gefehlt. diese Gene, die an der Synthese von Fettsauren 
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Elongatlonsschritten 7.. i rpi ica '^^y'-^oAs in mehreren Desaturierungs- und 

Enzyme des sogenannten Snned! pI?^^^^^ ! den Acyltransferasen handeft sich urn 
Acyltmnsferase, im foSeXo^^r^^T.^' Fettsauren. Glycertn-3-phosphat 

^ CB.O. ...... ^ .s^°s:::s^:srsrT^v 
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genannt, katalysiert den Bnbau von Acylgruppen an der sn-2 Position von Ly- 
^phosphatidsaure. nachfolgend als LPA abgekQrzt. Nach Dephosphorylierung von 
Phosphatidsaure durch Phosphatldsaure Phosphatase katalysiert Diacylglycerin A> 
cyttransferase, im folgenden DAGAT genannt, den Einbau von Acylgruppen an der sn- 
3 Position von Diacylglycerins. Neben diesen Kennedy Pathway Enzymen sind weitere 
Enzyme am Einbau von Fettsiuren In Triacylglyceride beteiligt, die Acylgruppen aus 
Membranlipiden in Triacylglyceride einbauen kSnnen. Phospholipid Diacylglycerin A- 

■ T^^J^^n!^"^^""^ ""^ Lysophosphatidylcholin Acyltransfem- 

se, nachfolgend LPCAT genannt. 

?^^^^Tf^^'^^ "-^^^^ ^'^^^^ Ratten beschrieben [Und 
(I960) Journal of Biological Chemistry 235: 2233-2237]. In RIanzen existiert eine 
plastidare isofonri der LPCAT [Akemioun et al. (2000) Biochemical Society Transactl- 
JTonm'J : ^ gebundene Isoform [Tumaney und Rajasekharan 

(1 999) ^ochimjca et Biophysica Acta 1439: 47-56; Fraser und Stobart. Biochemical 

rlf^'p ^^^^"^ ''^ ■T'^''^" ^'-e in Pflanzen 

an dei; Biosynthese und der Transacyllerung von mehrfach ungesStHgten FettsSuren 

Miotf """^ ^^^^^ 223: 305-314: Stymne und Stobart 

in f ofJ°f ^ Comprehensive Treatise', Vol. 9 (Stumpf. P.K. 

ed.) pp. 175-214, Academic Press. New York]. Eine wichtige Funktion der LPCAT oder 
20 allgemeinergesagtelnerAcyl-CoArLysophosphoIi^^^ nachfolgend 
LPLAT genannt bei der ATP-unabhangigen Synthase von Acyl-CoA aus Phospholipi- 

® T "^^"'^'^ ^ (2001 ; Journal of Biological Chemistry 276: 26745- 
dx>7o2) Descrineben. 

*''°<^^®"^'scHer Daten konrten bisher keine Gene kodierend fur LPCAT 
26 identrfiziert werden. Gene anderer verschiedener pflanzlicher Acyltransferasen konnten 
jsohert werden und werden in WO 00/18889 (Novel Plant AcyltrJisferases) besSrie 
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Hohere Pflanzen enthalten mehrfach ungesattigte Fettsauren wie Linolsaure (CI 8-2) 
und Unolen^ure (C18:3). Arachidonsaure (ARA). Elcosapentaensaure (EPA und Do- 
cosahexaensfiure (DHA) kommen wIe oben beschrieben im Samenol hSherer ^anzen 
gar nicht oder nur in Spuren vor (E. Ucclanii.Nouveau DIcKonnaire des Hulles V6g6ta- 
les Technique & Documentation - Lavoisier. 1995. ISBN: 2-7430-0009-0). Es ist vor- 
^talrPuSr^^ '^tT"' T""^^ "^P^' Lei". Sonnenblume und 
iTirZ^I^f- T'^^^''' ^.^ "^'^ ^^^^ SroBe Mengen qualitativ hochwerU- 
ger LCPUFAs fur die Lebensmlttellndustrie. die Tieremahrung und fQr pharmazeuti- 
sche Zwecke kostengunstig gewonnen werden konnen. HIerzu weixien vorteilhaft Qber 
gentechnische Methoden Gene kodierend fOr Enzyme der Biosynthese von LCPUFAs 
•n Olsaaten eingefflhrt und exprlmiert werden. Dies sind beisplelsweise Gene kodie- 
rend fur A-e-Desaturase. A-6-Elongase. A-5-Desaturase. A-5-Elongase und A-4- 
Desaturase. Diese Gene konnen vorteilhaft aus Mikroorganlsmen. Tieren und niederen 
Pflanzen isohert werden. die LCPUFAs herstellen und in den Membranen oder Trl- 
acylglyceriden einbauen. So konnten bereits A-6-Desaturase-Gene aus dem Moos 
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rSSrt.''"*^' und A-e-Elongase-Gene aus P. patens und dem Nematoden C. 

zen) erstnals beschneben. Diese Pflanzen produzieren allerdlngs LCPUFAs in Men- 
. gen d.e fur e.ne Aufarbeltung der In den Pflanzen enthaltenen 6le noch werte?oS" 
miert werden mussen. • wciier opa 

fnS""^ "^^^^^ ^"^^^^ ^""^ Hersteilung von mehrfach ungesattlg- 

1S Organlsmus zu entwickeln. Diese Au^Se 

15 wurde durch das erfindungsgemaBe Verfahren zur HersteJIung mehrfach ungesSer 
Fettsauren In einem Organlsmus, dadurch gekennzelchnet. dL das >^^Zen 
folgende Schritle umfasst: vwjidfiren 

In SPO^"wn"f Organlsmus mit der 

n SEQ ID NO: 1. SEQ ID NO: 3. SEQ ID NO: 5 Oder SEQ ID NO: 7 dargestell- 
20 ten Sequenz. die fur ein Polypeptid mIt einer Acyl-CQA:Lysophosphc^^? d 

Acyltransferaseakllvltatcodlert;oder w y^^w^upia 

b) EInbrlngen mindestens eIner Nuklelns§uresequenz in den Organlsmus die 

f c.^?"'" ^«9^"^rierten genetlschen Codes von Sr n SE^ ID 

►5 r«nd^; cf ""V- ^^"^ '° ' NO: 7 enthaltenen codle- 

■5 renden Sequenz ablerten lasst, Oder 

c) EInbrlngen mindestens eines Derivates der In SEQ ID NO: 1 SEQ ID NO- 3 
SEQ ID NO: 5 Oder SEQ ID NO: 7 dargestellten Nukleins.ur;iquinzTd^ 
Organismus. die fQr Polypeptide mit der In SEQ ID NO: 2. SEQ ID NO 4 SEQ 
ID NO: 6 Oder SEQ ID NO: 8 dargestellten AminosSuresequenz cod^e^en un6 
ZT^aX^ Aminosaureebene mIt SEQ ID NO: 2 SEQ ID 
NO: 4 SEQ ID NO: 6 Oder SEQ ID NO: 8 aufweisen und eine Squ^alente A- 
cy|.CoA:Lysophosphollpid-Acyltransferaseaktivitat aufweisen. und 

d) kultlvleren und emten des Organlsmus. 

S ' oeSf n^plif ^" im erfindungsgemSBen Verfahren hergestellten mehrfach un- 
SaTenSen ^^^^^ Doppelbindungen. Besonders 

ZTufllJ^f die Fettsauren vier oder funf Dpppelblndungen. Im Verfahren her- 
gestellte Fettsauren haben vortellhaft 16-. 18-. 20- Oder 22 C-Atome In der Fetts^ur^ 
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Hette. Diese hergestellten Fetlsauren konnen als einziges Produkt Im Verfahren herae- 
stellt werden oder in einem Fettsauregemisch vorllegen. ^ 

. Bel den im erflndungsgemaBen Verfahren verwendeten Nukleinsauresequenzen han- 
delt e§ sich um .soi.erte Nukleinsauresequenzen. die fOr PolypeptWe mit Acyl- 
5 CoA:Lysophospholipid-Acyltransferaseaktivitatcodleren. 

■ hergestellten mehrfach ungesSttigten Fetlsauren sind vortellhaft fn 

Membranl.p,den und/oder Triacylglyceriden gebunden. konnen aber auch als f rerp^- 
sauren oder aber gebunden in Fonr, anderer Fettsaureester in den Organisme^lof 
o T Q^^dt^ -Fleinprodukte" oder aber vortellhaft in Form 

0 von M schungen verschledener Fettsauren oder Mischungen umerschiedllcher S^^en^ 
de vorliegen. Dabel lessen sich die in den Triacylglyceriden gebundenen verShTeden 

J^'^.Vn^'''^'^^" '"'^ ' ^ mlttelkeffigenTela^^^^^ 

mrt 8 b,s 12 C-Atomen oder langkettigen Fettsauren mit 14 bis 24 CAtomen able'ten 
bevop^ugt smd die langkettigen FettsSuren besonde.^ bevonaigt sind d°e lanatetttae; 
5 Fettsayren LCPUFAs von Cie-. Cao- und/oder Q^FettsaurerT '^^Qkettigen 

T.^i^^^^"'^^''^^'^^^'^ ^^''^''^^^ Fettsaureester mit mehrfach un- 

Sn^!,NnH ""^^^e'-CarFettsSuremotekfllen mit mindestens zwei 

Doppeibindungen im Fettsaureester hergestellL Bevorzugt enthaften diese Fe^aur«. 
molekflle drei. vier oder fQnf Doppeibindungen und fOhren voSS ^ r Sy^S ^n 

S C?r4».^^^^^^^ ^= «^^"'^^>' Stea'^donsLT 

i-ouM, Dihomo-Y-Lino ensSure DGLA po'-^^s.h.mx es^^^^+^x,^ 

saurp (- PTA nor\'A as.8,ii.i4x a i •-'vai^, 4iu.,3 ), Eicosatetraen- 

Srlo t )' Arachidonsaure (ARA). EicosapentaensSure (EPA) oder 

deren Mischungen, bevorzugt EPA und/oder ARA. 

Die Fettsaureester mit mehrfach ungesSttigten C,^, C,8-. Cao- und/oder 
> Fettsauremolekulen konnen aus den Organismen. die fOr die Herstellung^r FettsSu- 

Verbindungeri vyie Sphingollpide. Phosphoglyceride. Uplde. Glycolipide wie Glv^ 
cosphingohp d. Phc«phoIlpide wie Phosphatidylethanolamin. pLpS^^^^^^ 
rerXnn^T' "^"^^^^''^^^^^'ol, Phosphatldyllnosltol Oder Diphc^phaS'ylgly. 
cerol Monoacylglycende. Diacylglyceride. Triacylglyceride oder sonsfige FeSurees 
ter we die AcetylCoenzymA-Ester. die die mehrfach ungesattlgter^^au^^i m^^^ 
destens zvvel bevorzugt drel Doppeibindungen enthalten. iS we^de^^^^^^^ 
Estern s,nd d.e mehrfach ungesattlgten Fetlsauren auch als-freie Fetlsaurefoder a? 
bunden ,n anderen Verbindungen in den Organismen vortellhaft derWaiSn eniS^ 
en. in der Rege, Hegen die verschledenen vorgenannten Verblndunger^^F^au"^^ 
^gI oI ^f?'"^^"> V:"" "'"^^ ""^etahren Verteilung ^ so 

- fhi^Tr? ^^^^ ^ ^^'^ Diglycerlde. 5 bis 10 Gew.-«/o Monoglyceriie 

1 b.s 5 Gew.-o/o freie Fetlsauren, 2 bis 8 Gew..% Phospholiplde vor. wobeSh dte 
Summe der verschiedenen Verbindungen zu 100 Gew -o/^ erganS. "^'^ 

Im erfindungsgemaSen Verfahren werden die hergestellten LCPUFAs mit einem Ge 
halt von mrndestens 3 Gew.-o^. vortellhaft von mindestens 5 Gew-t be^ von 
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mindestens 8 Gew..%. bespnders bevonzugt von mindestens 10 r«u, o/ 

dere bevorzugt von mindestens 15 Gew o/\°" "I'naestens 10 Gew.-%. ganz beson 

dertransgenenorganlsi^^^^^^^^^ 

erfindungsgemaBen Verfahren von den Au^^nn^^^^T ® '^ergestellt. Da im 
(C16:a), Unolsaure (ClsSVbrSnolenS/^^^ Hexadecadlensaure 
durchlaufen werden fallen dj^ndo^^^^^^ Reaktlonsschrltte 
donsaure (ARA) od^r Ssa^^^^^^^ ^'^ belspfelsweise Arachl- 

• es Bind immer auch J^ B^^TZTo^^^^^^^ "^'T ^^'^P^*^""^- an. 
dem Ausgangsorganlsmus border Au^^^^^ ^'"^ 

0 saure als auch Linolensaure vorhanden sXg^dte 

als Mischungen vor. Die Vorstufen sme^vn^^uLt ""^ EPA 

zugtnlcmmehralslSGe^^rreson^^^^^^ 

ganz besondeis bevorzuat nicht mehr c ^ 10 eew.-%, 

1 dukte nur ARA Oder nuT^A ert^r„^T»T,'™''*™" ^ B,*™- 

Durch^die erfindungsgemtBen NukleinsSuresequenzen kann «in^ e» ■ 
beute an mehrfach unaesatHoten PcM^a...!!!r " Steigemng der Aus- 

mindestens 80 -/o. bSTs^rt^S?^ ^""^'"destens 50 -/o. vorteilhaft von 
tellhaft von mindesfen" ?o %^^^^^^^^ ' ^ Sanz besonders vor- 

bairn Verglelch In der GC-Anal^s^s^/C^^^^ 

Auch chemisch reine mehrfach ungesaWgte FettsSuren oder P^^.. 

zungen sind nach den vorbeschriebenen Verfah^^ dL^L^I^^^ 

sauren Oder die FettsaurezusammensetzungVn Z de^n^^^^^^ ^ 

ganismen oder den PWanzen oder dem ^Zm^ Organ.smus wfe den Mikroor- 

nismen angezogen vy^rden ode^a^s o ^^"^ ^'^ Orga- 

kanmerWelebU^tlU^I^^^^^^ 

sr;=rmr^S 

b.sm.ellndus.-e.^ 

ptll^arS^^^^^^^^ verfahren kommen prinzl- 

charomyces oder ScWzosaochammv^ m °* TraustochyWum. Heten wie Sac- 
nicht-hlane Tlare ^^TSSSmabd^ k^'^ 'T Physcom«re«a Oder Cemtodon, 
lum Oder P«a„zen wie z^TeSSLe odlr e^L^'lS^t:;™ °^ 

cod..., --cv™ -TpiTn'TL^^CS^^^ 
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pflanzen. die groBe Mengen an Lipidverbindungen enthalten wie Erdnuss R«n« r> 
nola.Sonnenblume.Safflor(Farberdistel) Mohn Spnf Hanf ^ ' 

■ »n (Kaffee. Kakaa Tee). S^-Anen ^.^^^""drZu^^^T:. 
s^^P^anzen w,e sonne„«u.e. ^'TlS^'^jr:^ S 
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wie den vorteilhaften Pflanze lassen sich Mischungen der verschiedenen m«hrf«r^h 

ARA in freier Oder gebundener Form herstellen. Je nachdem welche Fetts§urP7i^«m 
. mensetzung in der Ausgangspflanze vorherrscht (018:2- oSlr C s lS^^^ 
5,, stehen so Fetlsauren. die sich von C18:2-Fettsau en aLte^ wle^^^^^ 

Tmrt'.f^'f C18:3-Fettsauren ableiten, wie SoSod^k^A^eZ 
• i- i^Ts J^^^r ^T- T"^' ""9^^^«'9te Fettsaure nur UnoisSi^ 

^^A PTA ^ ^® Lein. so konnen aJs Produkte des Verfahrens nur 

sekette lassen sich gezlelt in den voigenannten Organlsmen voSftTden vomT" 
nann en Pflanzen nur einzelne Produkte hersteilten Durch Sie /^Sde^lT^ 

) Desaturase und A-6-Etongase entstehen belspielsweise GL^ SuLf^OA 
DG^^J^T Ausgangspflanze und ungesat«gter Fettsaure Bevor^J^^i^^^^^ 
DGLA bzw. ETA Oder deren Mischungen. Wird die A-5-Desaturase zusaSichTdir 
Organismen vorteilhaft in die Rlanze eingebracht. so enJed^^A^^^, 
EPA Dies gilt auch fur Organlsmen in die vortier die A-^Desat^raTfunS ^ 

> Elongase emgebracht wurde. Vorteilhaft werden nur ARA odefE^A ode^dtS^MI 
schungen synthetlslert. abhSngig von der in im Organismus bL ^der Rlanrvn^--. 
genden Fettsaure. die als AusgangssubstanzfQr die SynthLT^fent n«^^^ 
Biosyntheseketten handelt. Hegen die ieweiligen E7dp^uS rJcralf^^^^^^ 

ganz besonders vorteilhaft wenioer als 5 a 9 «H«r t «! ^ 

Zur Steigening der Ausbeute Im beschrtebenen Veriahren zur Herstelluna «on Ai»n 

Dies ^ besonders vor.e»ha« .n^?^™du^?J,rCr^rC d^e*^.:^"- 
hohen Obauregehalt sufwelsen. Da diese Oiganisme^ nur ^^^^^^t^n 

a''^'-^al!.^L^SZ^rv?^S"""" - Her. 



wo 2004/076617 PCT/EP2004/000771 



11 



Im erfindungsgemaBen Verfahren verwendeten NukfeinsSuren stammen vorteilhaft aus 
Pflanzen wie Algen wie Isochrysis oder Crypthecodinium. AlgeiVDIatomeen wie 
Phaeodaclylum, Moose wie Physcomltrella oder Ceratodon oder hoheren Pflanzen 
.w,e den Pnmulaceae wie Aieurltla. Calendula stellate, Osteospermum splnescens oder 
5.4. Osteospermum hyoseroides, MIkroorganismen wie Pilzen wie Aspergillus Thrausto- 
chytrium Phytophtora. Entomophthora. Mucor oder Mortierella. Hefen oder Tieren wie 
Nemaloden wie Caenorhabditls. Irisekten oder dem Mensch. Vorteilhaft stammen die 
NuW^insauren aus Piteen. Tlererr oder aus Pflanzen wie Algen oder Moosen, bevor- 
zugt aus iSiematoden wie Caenorhatxlitis. 

10 Vorteilhaft werden im erfindungsgemasen Verfahren die vorgenannten Nukleinsaure- 
s^uenzen oder deren Derivat oder Homologe. die fQr Polypeptide codieren. die noch 
die enzymatsche Aktivitat der durch Nukleinsturesequenzen codlerten Proieme besit- 
zen Diese Sequenzen werden einzein oder in Kombination mit der fQr die Acyl- 
CoA:Lysophospholipid-Acyltransferase codierenden Nukleinsauresquenz In Expressi- 

5 onskoi^trukte clonlert und zum Bnbringen und zur Expression in Organismen venfl^en- 
de^. Diese Expressionskonstrukle emiSglichen durch ihre KonstrukHon eine vorteilhafte 
opMe Synthese der im erfindungsgemSSen Verfahren produzierlen mehrfach unge- 
sattigten Fettsauren. 

Bel einer bevorzugten Ausfuhrungsfomi umfasst das Verfahren femer den Schritt des 
SriTM ^'"^^ Sanzen Organlsmus, der die im Verfahren verwen- 

deten Nukleinsauresequenzen enthalt, wobel die Zelle und/oder der Organismus mit 
der erfindungsgemfiBen NukleinsSuresequenz. die fur die Acyl-CoA:Lysophospholipid- 
Acyltransferase codiert. einem Genkonslrukt oder einem Vektor wie nachfolgend b^ 
schneben, allein oder in Kombination mit weiteren Nukleinsauresequenzen, die fQr Pro- 
teine des Fettsaure- oder Upldsstoffwechsels codieren. transfomiiert wird. Bel einer 
weiteren^bevorzugten Ausfuhrungsfomi umfasst dieses Verfahren ferner den Schritt 
des Gewnnens der Felnchemikalie aus der Kultur. Bel der Kultur kann es sich bei- 
spielsweise um eine Fermentationskultur beispielsweise im Falls der Kultivierung von 
M.kroorgan.smen wie z.B. Mortierella. Saccharomyces Oder Traustochytrium oder um 
erne Treibhaus oder Feldkultur einer Pflanze handeln. Die so hergesteitte Zelle oder 
der so hergesteiite Organismus 1st vorteilhaft eine Zelle eines Ol-produzierenden Or- 
gamsrnus wie e^er Olfruchtpflanze wie beispielsweise Erdnuss. Raps. Canola, Lein 
Hanf. Erdnuss, Soja. Saffk>wer. Hanf. Sonnenblumen oder Borretsch. 

Unter Anzucht ist beispielsweise die Kultivierung im Falle von Pflanzenzellen. -gewebe 
Oder -organe auf oder in einem Nfihmnedlum oder der ganzen Pflanze auf bzw in ei- 
nem Substrat beispielsweise In Hydrokultur. Blumentopferde oder auf einem Ackerbo- 
aen zu verstehen. 

Zr?®""M Sinne der Erfindung bedeutet bezQglich zum Bei- 

sp.el e ner Nukleinsauresequenz. einer Expressionskassette (= Genkonstrukt) oder 
ernem Vektor enthaltend die erfindungsgemaBe Nukleinsauresequenz oder einem Or- 
ganismus transfomiiert mit den erfindungsgemaSen Nukleinsauresequenzen Expres- 
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sionskassette Oder Vektor alle solche durch gentechnische Methoden zustandege- 
kommenen KonstrukMonen, in denen sich entweder 

.a) die erfindungsgemSBe NuWeinsauresequenz, Oder 

5*' flfrJ*H®'..®'^l"^^^^^ Nukleinsauresequenz funktionell verknQpfte 

5 genetische Kontrollsequenz, zum Beispiel ein Pipmotor, oder 

0) (a)und(b) 

"m I'^J*"'®' "^^"•^'cf^®"' genetlschen Umgebung befinden oder durch gentechni- 

on. Addition. Deletion, Inversion oder Insertion eines oder mehrerer Nukieotidreste sein 
10 kann. NatOrllche geneUsche Umgebung meintden natOrlichen genorscheTb^ 

chromospmalen Locus In dem Herkunftsorganismus oder das Vorllegen in ein^geno- 
mischen B.bliothek. Im Fall einer genomlschen BIbllothek 1st die natOrliche Ss^e 

umgebung flantaertdie Nukleinsauresequenzzumindestan einer Seite und hat eine 
15 Sequen^&nge von mlndestens 50 bp. bevorzugt mindestens 500 bp. be^nders bevor- 
zugt mindestens 1000 bp. ganz besonde.^ bevoizugt mlndestens ^ ^ Bne nX 
hch vorkommende Expresslonskassette - beisplelswelse die naturilch vor^omm^T 

mfttr!^'''' k"* w "'T erfindungsgemafien Nukfeinsare^^uL 

20 ^'^P'^^f Acyl-CoAtLysophosphollpld-Acyltransferase -Gen - JST 

rZSrJ"^^^'^''^^^^ ^"^^^"^ nicht-naturliche. synthetS^he 

( kuns^hche ) Verfahren wie belspielsweise einer Mutagenlsierung geSndert wird Ent 

WO 5 beschrieben In US 5.56i.350 Oder 

Unter transgenen Organismus bzw. transgener Pflanze Im SInne der Erflndung ist vwe 

SZlhrSf'"' verwendeten Nukleinsaurt^^n'iht an 

ihrer natOrlichen Stelle im Genom eines Organismus sind. dabei kSnnen die Nuklein- 
sauren homolc^ oder helerolog e,cprlmlen werden. Transgen bedeutet auch 
G^ltTn^ erfindungsgemaeen NuklelnsSuren anlhrem natOrlfcherPia^^r 
Genom eines Organismus sind. dass jedoch die Sequenz gegenOber der naturllchen 
30 sequenz verandert wurde und/oder das die RegulatLssequLen. der 
Sequenzen verandert wurden. Bevonoigt ist unter transgen dl^ 
dungsgemafBen Nukleinsauren an nicht natOriicher Stelle Im-Genom zu verstehen das 
hedBt eine hornologe oder bevorzugt heterologe Expression der NuklelnsSuren h1 

35 r oSSir Sid 

- Als Organlsmen bzw. Wirtsorganlsmen fOr die im erfindungsgemaSen Verfahren ver- 
wendeten Nukleinsauren. die Expresslonskassette oder den Vektor eignen 5.^0X1- 
pidl vonellhaft alle organlsmen. die in der Lege sind Fettsauren speXn^s^Ze 
Fettsauren zu synthetlsleren bzw. fOr die Expression rekomblnanter Gene geeS^f 
sind. Beispielhaft selen Pflanzen wIe Arabldopsls. Asteraceae wIe Calenduroder^^^^^ 
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^rpflanzen wie Soja. Erdnuss. Rizinus. Sonnenblume. Mais. Baumwolfe Rachs R«n« 
Kotosnuss Olpalme Farbersafflor(Carmam^ 

ganismen w.e Pilze beisplelsweise die Gattung Mortierella. Saprolegnia Oder' PvthTum 
.Baktenen wie die Gattung Escherichia. Hefen wie die Gatl^ng Saccharo^^^^^^ 
nobaktenen. Ciliaten, Algen oder Protozoen wie Dinofiagellaten wie cS^diSl 
genannt eevorzugt warden Organismen. die naturlichemeise Ole in gXreTZaen 
synthef^eren konnen wie Pilze wie Mortierella alpina. Pythlum insidiosroder P^^^^^^^^ 
zen vwe Soia. Raps. Kokosnuss. Olpalme. FS*ersafftor. Flachs. Hanf Rilus (S en 
du a. Ejdnuss Kakaobohne oder Sonnenblume Oder H^fen wie S^^^s ^re^^ 

Calendula. Mortierella oder Saccharomyces cerevisiae. Prinzipiell sind a^m^^ol' 

teZftTSTn" "T"^""*"" Organismen auch t^sgene ~r- 

teilhaft nicht-humane Tlere geeignet beisplelsweise C. elegans. 

Nut2bare.Wirtszellen sind weiterhin genannt in: Goeddel. Gene Exoression T«nhnni« 
gy: Methods in Enzymology 185, Academic Press. San iSgo^^f^^^^!" 

Venvendbare Expressionsstamme z.B. solche. die eine geringere ProteaseakBvliat 
au^elsen sind beschrleben in: Gottesman. S.. Gene res^on TeSno^^^^ 
.n En^mology 185. Academic Press. San Diego. California (1990) I19IS 

Hierzu gehSren Pflanzenzellen und bestimmte Gewebe. Organe und Telle von Pflan 
S B^elnungsformen. ^e Antheren. Fasern. WurzJ^haltrngT" 
Embryos. Kalli. Kotelydonen. Pettolen. Emtematerial. pflanzliches Gewebe reorodukti 
ves Gewebe und Zellkulturen. das von der eigentllchen transgenen Sze ZeleUet 
.St und/oder dazu verwendet werden kann. die transgene Pfl^ze herv^bn^ Jn 

Transgene Pflanzen. die die im erfindungsgemSBen Verfahren synthetisierten mehr 

ohne dass. die synthetisierten Ole. Lipide oder Fettsauren Isoliert werden rnoZ? Un 
zenS ^'^'"^-S^^f Verfahren sind ganze Rlanzerso^e ar^^^^^^^ 

zenteile. Pflanzenorgan© oder RIanzenteile wie Blatt. Stiel. Samen. Wurzel Knollen 
Antheren Fasem. Wurzelhaare, StSngel, Embryos. Kalli. Kotelydonen ^tien^^^^^^ 
S"niri'^r''^^^^^ T'^' reproduktives Gewebe. Zellkulren"dte^^^^^^^ 
fran^enen Rianze abgeleiten und/oder dazu venvendet werden k6nnen die transot 
men ^ervomen^Der Samen umfasst dabel alle Samentelte 1 dif^!^^ 
menhullen. Epidemils- und SamenzeHen. Endospemi oder Embyrogewebe Dfe i^ 
erfindungsgemSBen Verfahren hergestellten Verb|ndungen konnriTauch aus den 
Organismen vorteilhaft RIanzen in Form ihrer Ole. Fett. Uplde unllLr fr^en Fe^at 

sauren lassen sich durch Emten der Organismen entweder aus der Kul^rTder ste 

wachsen. oder vom Feld emten. Dies kann uber Pressen oder ExlraS^on 

der RIanzenteile bevoi^ugt der RIanzensamen erfolgen. Dabei k6nnen die Ole Fette 

Ohne Zufuhn^ng von W^e durch Pressen gewonnen werden. Damit slcrl ^an- 
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zenteile speziell die Samen leichter aufschlie3en lassen. werden sie vorher zerkiPinort 
gedampft Oder geroslet. Die so vorbehandelten Samen Wiw! ^? « ;®™®'nert, 
wprrien rxHtxr r«» i a-..^ . '7' """«*""«*"en &amen Konnen anschlieBend gepresst 
?! ^® Losungsmittel wie warmen Hexan extrahiert werden AnschlieSend 

m.sch/phys,kal.sch durch Zugabe von Saure wie PhosphorsSre erfS Tr^schl^ 
hit^Tntnf ^-^^^^^ Prxxlukt wlrd zur Entfernung der im pS^er- 

^^T^XTp^""-'"^ "'TT produzlerten PUFAs bzw. LCPUFAs 

2 ^ ^ -! Ca2-Fettsauremolel<ule mit mlhdestens zwel Doppelbindunaen im F^tt 
20 sauremolekul vorzugsweise drei. vier. fOnf oder sechs DoppelK^^ DiesT C 
C20- Oder Caa-Fettsauremolekule lassen sich aus dem OroanlsZs in r^'' 

Eine Ausfuhrungsform der Erfinduna sind deshaih i r- ^ « 

fassen und von transgenen Pflanzen herrOhren "'^nseizung. die PUFAs urn- 

werden. Das Ol. Up,d Oder Fett kann verschiedene andere gesattlgte Oder ungesSttlgte 
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Fettsauren. z.B. CalendulasSure, Palmltln-. Palmitolern-, Stearin-. OlsSure ete enthar- 
Fettsauren in dem 01 oder Fett schwanken. 
k'' mL^Ili'^^®'*^ n®" hergestellten mehrfach ungesattigte FettsSuren mit vorteflhaft 

Sphingolip.de, Phosphoglyceride. Upide. Glycolipide. Phospholipide. Monoacylglycerin 
. DiacylgIycenn,TrlacylglycerinodersonstigeFetts§ureester onoacyigiycenn. 

Aus den so Im erflndungsgemaBen Verfahren hergestellten mehrfach ungesattigte 
Fettsauren mit vortellhaft mindestens zwei Doppelbindungen lessen sich dleTr^malten- 
5 den mehrfach ungesattlgten Fettsauren belsplelswelse Qber eine Alkallbehandrng 
be.sp.elswe.se waBnge KOH oder NaOH oder saure Hydrolyse vortellhaftirS- 
wart ernes Alkohols wie Methanol oder Ethanol oder Qber eIne en^matische^spal- 

iTs^SXILTso r^'^^ Phasentrennun7und anschlSer 

Ansau^mng uber z.B. H2SO4. D.e Frelsetzung der FettsSuren kann auch direkt ohne 
> die vorfiergehend beschrlebene Aufarbeitung erfolgen. 

Die Im verfahren ven«endeten Nuklelnsauren konnen nach Einbringung In einem Or- 

prrio.?!!;'' "'r ^^^^^^^^ -^^^r Jei^^zzz 

Plasm.d liegen Oder in das Genom der Wfrtszelle Integriert seln. Bel Integrathxi In das 
. B^Zr^Jl^T'Tn clurch derartfge ReZb^aS^n 

p^^' T ^ """'^^ ^'^ eingebrachte Kopie ersetet wird, wodurch die 

Venvendung ernes Gens in trans, so dass das Gen mit einer f unktionelten Expre^l- 

^J^JJ^ZTT" 1" Polyadenylierung eines funktionell transkn^ferten G^^^ 
gewahrl^ stende Sequenz enthfilt. funktionell verbunden ist. Vortellhaft werden die 
Nukleinsauren uber Multlexpresslonskassetten oder Konstrukte zur LlXileten Ex- 
press.on .n d,e Organlsmen vortellhaft zur muWparallelen samenspezlSXn ^preSl- 
on von Genen In die Pflanzen gebracht »>M««n&cnen txpressi- 

Moose und Afgen sind die elhzlgen bekannten Pflanzensysteme. die erfiebllche Men- 
gen an mehrfach ungesattlgten Fettsauren. wIe ArachldoLaure Alt^^ und^^^^^^ 

pr^fo ? Membranlipiden wahrend Algen. algenvenvandte Organlsmen und einlqe 
Pilze auch nennenswene M^ngen an PUFAs In der TriacylglycerolLkbon akkumu te 
Tn d^PUPr" T T''"«^"^e^°'ekQle; die aus sotehen StSmmeri^'feT^^^ 
den die PUFAs auch .n der Triacylglycerolfraktlon akkumulleren. besonders vortrhaft 
^rdas erfmdungsgemaBe Verfahren und damit zur Modiflkation des Sp^- und P^^^^^^ 
Produktions^^stems In eInem Wirt. Insbesondere Pflanzen. wie Olfmch°pflanzen b^C 

SibtSL^'r^' "^T' Sonnenblumen. Borretsch. Sd des- 

halb vortellhaft im erfindungsgemSBen Verfahren venwendbar. 

werden vSSS^ erf^dungsgernaBen Acyl-CoAiLysophospholipld-Acyltransferasen 
weraen vorteiihaft Cie-, C,8-, Car Oder OarFettsauren venwendet. 
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Desaturase ain&chst desatunert und anschlieBend uber eine Elongase urn mindestens 
• Kohlenstoffatome verlangert warden. Nach efner Elongalionsmnderhrt d"2e 

tZZ^r^Z C24-Fettsauren. D,e AKHvitat der erfindungsgemSSen Verfahren ver- 
wendetenDesaturasenundBongasenfuhrtvorzugsweisezuC^. C .unci/nrt2rr 
Fettsauren vorteHhaft mft mindestens zwel Doppelbindungen ^^^^^ 

und/oder Fettsauren mit mindestens zwei Doppelblndungen im Fett^ureiSekQI 
vorzug^eise mlt drei. vfer oder fQnf Doppelbindungen Im Molekul. NaSm ehf el 
te Desahinemng ur^ die VerlSngerung stattgefunden hat. k6nnen y^^^DesZlB 

3u'4r.ri?- "^"^ ^"Po-«^" ^rfo'sen. Besonders bevo^ugt "s 

Produce des erfmdungsgema3en Verfahrens sfnd Dlhomo-Y-Hnolensaure. Ara^idon- 

C F^^T'^TJ' '^°^°^^P«t^«"^"^« "Hd/oder DocosahesaenstSrOfe 
SrrSS '""tm-ndestens zwel Doppelblndungen in der Fettsaure konnen durch 

f!^ T^^T''^^1^"T'^^ ''^^^ Fettsaure oder in 

Fomi der Ester, wie Phosphollpide, Glycolipide. Sphingollpide. Phosphoalycerlde Mo- 
noacylglycerln. Dlacylglycerln oderTrlacylglycerin:veriangert werSi?.^^ 

Der bevonzugte Blosyntheseort von FettsSuren. Glen. LIplden oder Fette in den vorteil- 
scl'Z'lfr ^"""'"i"* belsplelswelse im allgem^nen der Samen ^er Zel^- 
SLX^^M f^r"'' '° samenspezlfische Expression der im Verfahren 

ven««ndeten NuWeinsauren sinnvoJl ist. Es ist jedoch nahellegend, dass die Biosvn- 
these von Fettsaur«n. Olen oder Upklen nicht auf das Samengew^be S^llTsein 
muss, sondem auch In alien Obrigen Teflen der Pflanze - belsSels^^rSe^mfs" 
zellen oder in den Knollen - gewebespezlflsch erfolgen kann. ^P'«^ermis 

Werden im erfindungsgemaBen Verfahren als Organlsmen MIkroorganismus wie Hefen 
wie Saa^haromyces oder Schlzosaccharomyces. PHze wie MorBer^rirei 
Phytophto^ Entomophthora. Mucor Oder Traustochytnum Algen^^^S ' 

^Sre-rSL^a;^^^^^ 

Durch die Verwendung der erflndungsgemaBen Nukleins§uren, die fQr Acyl- 
CoA:Lysophosphollpid-Acyltransfe,asen codieren. konnen Im Verfahren die hergestell- 
ten mehrfach ungesSttigten FettsSuren mindestens um 10 % . bevorzugt mindeSns 
urn 1 5 %. besonders bevorzugt mindestens um 20 %. ganz b;sond^trr^u2 ur^ 
mmdestens 50 % gegenuber dem Wildtyp der Organlsmen. die die NuklelnsSurSi nTcht 
rekombinantenthalten,erh6ht werden. « i^uweinsauren nicht 

Durch das erf indungsgem§l3e Verfahren kannen die hergestellten mehrfach unaesat 
IT f^r'^y venvendeten OrgSilsmen pr^^p^Se^^^^ 

Fetlsauren und/oder der Antell der uber das Verfahren hergestellten veresterten mehr- 
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Werden im erfindungsgemaBen Vertahren als Organlsmen Mikroorganlsmen veiwen- 

• urn, das erne Kohlenstoffquelle meist in Form von Zuckem eine Stick.rfnffn, m^io! 
.n Form von organlschsn Stickstoffquellen Hefeext,BS orsS^S^Alo^^^^ 

Cbiseo Cunter§auerstoffbegasungange2ogen.DabeikannderDHderNahrfm<» 
s.gke,t auf einen fasten Wert gehalten warden. 3as helBt wah^endTATOe^^^^^^ 

r?^" •'^^'^ '^^••s^' sami batch welse ^aXnJnS^^ 

erfdgen.Nahrstoffe konnen zu Beginn dar Fermentation vorgaleX^ ir^^ 
. kont.^^.erl.ch Oder kontinularllch nachgefQttert warden. Die harge^aSen mThrfach un 
gesatt.gten FettsSuran kSnnan nach dem Fachmann bakanntan VaS^^a o^en 
beschnaben aus den Organismen isoliert warden. Baispialswelse Qter BrtTk^i^^^^ 
tination Kristallisation. ggf. Salzfallung und/odar Chrom'Jog^rSa 
kOnnen dazu vorhar noch vortaflhaft aufgeschlossen werden. ""^anismen 

> Das erf indungsgemase Verfahren wird. wenn es sich bei dan Wirtsorganismen urn 
M.kroorgan.smen handelt. vorteilhaft bei einar Tamperatur zwischan ^'^bTs 95 "c 
bevomigt 2w,schan 10 "C bis 85 -c. basonde,^ bavorzugt zwischen 15 -C bis 75^c 
ganzbesonderebevofzugt2wischanl5»Cbis45''Cdurchge«hrt 

Der pH-Wert wIrd dabel vorteilhaft zwischen pH 4 und 12, bevorzugt zwischen oH e 
und 9, besonders bevorzugt zwischen pH 7 und 8 gehalten. ^ 

^nd penphe™ au,chu,ngen (Vieweg Va^g. Bmunschwei;^^.'?"^^^ 

Das zu ven»endeiide Kultumiedlum hat In geelgneter Welse den Ansnrtw,.™ -„ 
walllgen Stanme zu ganOgen. Be^^e^^^"ZZetn^^^^^ 
nx-rgansman sind In, Handbuch "Manual of Methods «r Gena^TsS^^ 
Amencan Society «r Bactariology (Washington D. C. USA. 1981) 

- Dtese eriindungsgemas einsetzbaren Median umfassen vWe oben beschrf<tf«» ^ 
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Bevoijugte Kohlenstoffquellen sind Zucker. wie Mono-. Dl- oder Polysaccharide <5Ahr 
gate Kohlenstoffquellen sInd beispielsweise Glucose. Fructose Man^fcTJ^^^^^^^ 

IuIS'm T'"'^"^'^"' saccharose. Raffinose It^r^e td^^^^^^ 

. lulose Man kann Zucker auch Ober komplexe Verblndungen. wIe Melkssen od«r «n 
5,., dere Nebenprodukte der Zucker-Raffinierung zu den Medln gebe7^ K^n^^^^^^^^^ 
terihaft sein. Gemlsche verschiedener Kohlenstoffquellen zuzuaeben An^r^ m^^^^^^^ 
Kohlensto«qu^,en sInd Ole und Fette wIe z. B. Sc3a5 I SoSur^^^^^^^ 
• und/oder Kokosfett. FettsSuren wie z. B. Palmftlnsaure. StearinsiuTe ^^oS^^^^^^^ 
1 o Polyalkohole ««e z. B. Glycerin. l^teZruSer L^anol 

10 und/oder organische SSuren wie z. B. EssigsSure und/oder MItehsaure 

Stickstoffquellen sind gew6hnlich organische Oder anorganische Stickstoffver- 
^offnCr °'";'^^^^'''"^«^"' d'^-e Verbindungen enLlten. BeispShS^^ stick- 
stoffquellen umfassen Ammoniak in flussiger- oder gasform oder iJ^^l^l ■ 
Ammonlumsulfat. Ammonlumchlond. Amr^oniumphosp^aT^^^^^ 
15 Ainmomumnitrat. Nitrate. Harnsloff. ArnlnosSuren oder kompl~ck^^^^^ 

Stickstoffquellen konnen einzein oder als Mischung venArendet werden. 
:io°rht??!''1,?^'T*'"^^^^^ "^^^ ^^^^"^ enthalten sein kSnnen umfassen 

Als Schwefelquelle fOr die Herstellung von schwefelhaltigen Feinchemikalien insbe 

organ,sehe Schwefelvert-^lungen. wie Mercaptene und TO^^Z^C^ 

25 Als Phosphorquslle kOnnen PhosphorsSure. Kalluiwllhyrtogenphosohat Oder Dlkan 
umMrogenphospha. Oder <«e enUpreohenden N«rt™ h^^g^^ve^rST 

re,NiRotin8aure, Pan«««>eiiaturidPyi1dOxlnflehdrBn. Wachstumsfektorenund^^^ 
stammen haufig von komplexen Medienkomponenten, wie H^^K^ta.^„ 
^- l>telsqueUwasser und derglefchen. Dem Kultumiedlum l^nenSS Vn, 

^^r^rT- ZusammenseUunTrM^S^S^n 

eii enteohieden nformation uber de Medienoptimlening ist eitiiniksh aus dem Lehr 
bud, "Appted MKroblol. Pl,y8totogy, A Praottcal App,o^ii- (Hr^. ?m Rl^'it P. 
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Stanbury IRL Press (1997) S. 53-73. ISBN 0 19 963577 3). Wachstumsmedien lassen 
sich auch von kommerziellen Anbietern beziehen. wie Standard 1 (Merck) oder BHI 
(Bram heart infusion, DIFCO) und derglelchen. 

Medlenkomponenten werden. entweder durch Hfee (20 min bei 1 .5 bar und 
5 121-C) Oder durch Steriifiltratlon. sterilislert. Die Komponenten konnen entweder zu 
sammen oder nStigenfalls getrennt steriHsiert werden. SSmtliche Medienkomponenten 
• konnen zu Beginn der Anzucht zugegen sein Oder wahlfrel kontlnuierlich oder char- 
genweise hinzugegeben werden. 



0 



5 



K '® J^^'^?!'' "®9t nonnalenwelse zwischen 15°C und 4S°C, vorzugsweise 
be. 25"C b,s 40OC und kann wahrend des Experimentes konstant gehaten oS? ve^ 
dert werden. Der pH-Wert des Mediums sollte Im Berelch von 5 bis 8.5. vorzugs^S^ 
um 7.0 l.egen. Der pH-Wert f Or die Anzucht lasst sIch wahrend der AnzLcht dur^Zu 
gabe von^basischen Verblndungen wIe Natrlumhydroxid. Kallumhydroxid. Ammonlak 
bzw. ArTimon.akwasser oder sauren Verblndungen wIe Phosphorsaure oder SchwefeL 

f rF^"i'n r."- f 1"°"'^°"^ Schaumemwlcklung k6nnen Antlschaummmel wIe 
z^B. Fettsaurepolyglykolester. e.ngesetzt werden. Zur Aufrechterhaltung der Stabilltdt 

wnPlasmiden konnen dem Medium geelgneteselektlvwirkendeStoff^^ 
biotka hInzugefQgt werden. Um aerobe Bedingungen aufrechtzuerhalten. werden 
Sauerstoff oder Sauerstoff haltlge Gasmlschungen. wie z. B. Umgebungslufl, in die 
Kultur eingetragen. Die Temperatur der Kultur llegt nomiaien(veise bei 20-C bis 45»C 
und vorzugsweise bei 25=0 bis 40-C. Die Kultur wird solange fortgesetzt. bis sich e\n 
Maximum des gewunschten Produktes geblldet hat. Dieses Ziel wird normalenveise 
innerhalb von 10 Stunden bis 160 Stunden erreicht. "wierweise 

Die so erhaltenen. insbesondere mehrfach ungesattigte Fettsauren enthaltenden Fer- 
mentatronsbrohen haben Obllchenveise eine Trockenmasse von 7.5 bis 25 Gew -ol 

Die Fermentationsbriihe kann anschlleBend welterverarbeitet werden. Je nach Anfor- 
Zn^H^ZTlfT"^ Oder tellweise durch Separatlonsmethoden. wie z. B. 

. f Combination dieser Methoden aus der 

Fermentationsbruhe entfemt Oder vollstandig In Ihr belassen werden. Vorteilhaft wird 
die Biomasse nach Abtrennung aufgearbeitef. 

Die FermertetlonsbrQhe kann aber auch ohne Zellabtrennung mit bekannten Metho- 
den v^e z. B. mIt Hilfe eines Rotatlonsverxlampfers. DQnnschlchtverdampferSSfilm- 
verdampfers. durch Umkehrosmose. oder durch Nanofiltratlon. elngedlclTSSehun^^^ 

'^Z^^^'^T^^'''''''''' '^'^^^ -"fkonzentrierte Femientatlonsbruhe tenn ^ 
schlieBiich zur Gewinnung der darin enthaltenen FettsSuren aufgearbeltet werden. 

Die im Verfahren gewonnenen Fettsauren eignen sich auch als Ausgangsmaterlal fOr 
die chemische Synthese von welteren Wertprodukten. Sie kSnnen belspfelswSse n 
Komb.nat.on mrteinander Oder allein zur Herstellung von Pharmaka. Nahrungsmlttel 
Tierfutter oder Kosmetika venwendet werden. ^^i^^faei. 



a) 

10 b) 
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Vo^aftelsorerteNukleinsaure^uenzenslndSequenzenausgew^^ 

NO: 7 enthaltenden codlerenden Sequent ableien lassen ^ '° 

Quanta und QuantMt erfo^n ^^^hl^s kaZ^Lt!' '^."""^ """"^ 
daidprotokoll geremigt vwi*n te b o^I^f ^ ^t, ' Amplrtkat nach einem Stan- 

aehfdannwr'dla rJfhS^Se woSLfCeSr^ ^'"""««^ 

d.,„.,k™.e,,e„svs.e™rsrj^r;„::r^n!rv^^^ 
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zlente Klonierung in Hefen Oder Plize gew§hrleisten imrt h!« ^ 
begrenzenden Sequenzen rr-DNA-Bnrrtort ^^klT^w "'-^"e fie T-DNA 

bestimmtes Nukleinsaurekonstrukt bzw Ve^r^rSf! 

^^^^^ 

sich vorteilhafterwelse in iVIikrooraanismpn m^hLl^H^ ^ J Konstrukte lassen 

weiden und damif bei der PflanzBntfa™^^^ vorteilhaft Pflanzen einoebracht 
die vere«en«fc« -^n^^^ST^^Z^^S:' 

nng and Uttotion, Hrsgb.: Kung und R. Wu. ^oadeS-Z.^; 1^1^^ 
kus, Annu. Rev. Plant Physiol. Plant Moteo. Biol. 42 (l^irSs S"^'- 



20 



25 



30 



WO 2004/076617 

PCT/EP2004/000771 

22 

eines breiten Spektrums an Organlsmen vorteilhaft an Pflanzen varw«nH« 

diese bessere und/oder effi^entere Pro^uzernenZTpu^^J,^^^^ '° .^^^ 

. Es gibt eine Reihe von Mechanismen. duroh die Hie WoriinH™. 
5 uncVoder BBzienz der Produktion aine;^^^ r *® Ausbeute, Produktlon 

Oder iGens scWe JS.IZ^S^^i^^^Z^Z^:^'"^' 
I Mengen der produzlerten Veitindunoah a. . "^"^ ®° S*"®™ 

sprechenden GensAaenTfehte&l^T^^.™'''^"' Hnbringen des/derent- 
Desetu,asen oder^n^^^e^SfT* '^'"'"nation m we«e,en 

pidsto^^onse,. Aucn ^^r:^:^,zzTTzzir 

,^abH^vo.Be.e«r^r«2ri;Xr:^^ 

Desaturase- uSd/oder^3^Q^' ^'^^^'-''^^ 
mit ande«n Genen Z^?Z tenn „ a»el" Kombination 

erMht. sondem ^^^^^^J^^ B»synthesefluss zum EndproduW 
Oder de novo aeschaffa^ Z^^^^^ TnacylsDycenn-Zusammensetzung erhsht 

ne. die am rm^^^^lSl'^^^r^t^'' 

mlkalten.(2.B Fettsauren S«i ^.tT^ ^* e'neroclermehrerer i=elnche- 

nerl^lb der zenen Oder innerWbSssl^t^r 

gestelgert wird. Fe»^^euZa^,^ITJ^jr,"2 '"Sf"*" beschrteben. vrelter 
diTCh Optimiemng der AldS oder^^S,^ ! Feinchemikalien wOnschenswerl; 
CoA:LysophoephS,p,d.^^Z^Sute^-^^^^^^^ ^ 
Biosynthese dieser Verblndunaen haML*^^^ ®' Elongasen, die an der 
ner Oder met,rerer dJ^^",^^^^ dun^ Zerstoreo der AkUvie, ei- 
l«nn es mSglicI, sein, ,«e Sut T^ZZIZl^'tS^. 

.e.n ^er Te,e davon 1^^^:^^''^^'" ^'"^'"^ 
ai einer AminosSuresequenz der SrouJ^ml^S *^^«"=hend homolog 
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CoAil^sophospholipld-Acyltransferase-AktM^^^ beibehSlt. Vorzugswelse hat das Pm 
te.n oderderTeil davon. das/der von dem NuklelnsauremolekQl ^bTJ^^^^^ 
ne wesentliche enzymatfsche Aktlvltat und die FShigkelt. am^o^ec^sT^n z^^^^^^^ 
Aufbau von Zellmembranerroder Upidkfirperchen in Or^nismenvortei^^^^ R,L.n 
"^^^"d'genVerblndungenoderamTransportvoniy^ 

fr^ ^ Aminosauresequenzen. die an Position 30 der QFn 

D NO: 2 anstelle des vorhandenen Methlonin einen VBi^nre^habT^nnPol^^ 

Unter wesentlicher enzymatischer AkBvitat der venrt^endeten Acvl CnA-i „ 
^^f^.-^" vemendbare Nutdeinsauren slammen aus Pllzen Oder Pften 



wo 2004/076617 

PCT/EP2004/000771 

24 

Die im Verfahren verwendeten Nukipme5..r^c.^«. ^ 

ganlsmen Oder l^n e^^'S^^r " '^'^^ 

5 die vemendeten Desaturasen unSr 

quenzen mit einem Oder r^^^^2>^^ codierenden Nukleinsfiurase- 

die gezielte Expression der Qe^un^^^„'^"'''°''=*''«" Sequenzen sollen 
belsplelsweiseie nact, Wirt^fe™ eimagiichen. Dies kann 

10 e«primiert und^ider atereSS ld ^T"' '"**»<« 

um Sequenzen an <<le IndulZn c2*f^^' ''^ '^"!«°'J=''e'> ^^luenzen 
Nuldeinsaure regulieren Zusatzlich7. rtZIf^ und so die Bqjresslon der 

stelle dieser Sequen^n ten^^^aa^^" "'^ •^9.'*«°™^"en»n Oder an- 
15 gentnchen Struidu^nen ^ wS^n sJI^^S" T^' f*"'^""" vor den ei- 
dert wftitlen sein, » dass die segebenentalls geneUsch veran- 

der Gene erheht vmrde^ie E^^^^SlT T^'^^^ "'^ Expression 
konstmkt) l<ann aber auch einStef^^^^ f«P™«s*>'«tonstrultt = Gen- 
llchen Regulatlonsslg^e iTuM^SlT- *T ^ 
20 und der natflrtiche P™noJ^7s«ner '"^"« 
wu«le die na«rtiche ^eglZS^^^^^T T^' ^t^*^" 
folg. undtoder die Gene^reS^Sta^ZT iJLf^ "^"'^ 
nen in Fom, von Tellsequen2^7iCS™f t^T-™'^'*" P"""*"*" k6n- 
lelnsauiesequenzen) auch S, v»r ZTl-T J*"^" "^^ efindungsaemaBen Nulc- 

mehrere s09enannte%^C^t^^.l!Sr„,7'»l^!^^^^ Oder 
enthaiten. die eine erhehte Expre^n^NuM^l 

am 3'-Ende der DIW-Sequena^Zn^TL^trT «™«9«*en. Auch 

warden wie welte« i^wSaZ^nte^ t ^^^^'''^^ Sequenzen inserlert 

0 CoArLysophosphollpid aSSS.S^^^T'"^"'- 

Desaturase-, A5-Desatu^Zl^^!^ ^ voiteilhaft ven«endeten A-4. 

sem. Vorteilhaft IfeBf ^ZSl^Z^^T^^t ^^'^^ enthaiten 

1 Dieses GenkonstnS; ^IT^^^J^^^l^ E«P'essionsKasse.,e vor. 
expnmiert wewen. Dal,ei kann Z^^^^^fT^ VWrtsorganismus 

duroh erhehen. So S^ZZ^^JfT ."T? "^^"^"^ ""d da- 
weisea.derT,ans.pt^-rS:ir.rrTS;,^ra^^^ 
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Promotoren und/oder "Enhancer veiwendet werden. Daneben 1st aber auch eine Ver- 
starkung der Translation moglich, indem beispielsweise die Stabilitat der mRIVIA.ver- 
bessert wird. 

Eine weitere Ausfulirungsform der Erfindung sind ein Oder mehrere Genl<onstrulcte. die 
5 eine Oder mehrere Sequenzen enthalten, die durch SEQ ID NO: 1 , SEQ ID NO: 3, SEQ 
ID NO: 5 Oder SEQ ID NO: 7 Oder dessen Derivate definiert sind und fur Polypeptide 
. gemaS SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6 Oder SB3 ID NO: 8 kodieren. Die 
genannten Acyl-CoA:Lysophospholipld-Acyltransferasen fOhren dabel zu einem Aus- 
tausch der Fettsauren zwischen dem Mono-, Di- und/oder Triglyceridpool der Zelle und 
TO dem CoA-Fettsaureester-Pool, wobei d^is Substrat vorteilhaft ein, zwei, drei, vier oder 
fOnf.Doppelblndungen aufwelst und vorteilhaft 16. 18, 20, 22 oder 24 Kohlenstoffatome 
im FettsauremolekQI aufweist. Gleiches gilt fQr Ihre Homologen, Derivate oder Analoga 
die funktionsfahig mit einem oder mehreren Regulationssignalen, vorteflhafterweise zur 
Steigerung der Genexpression, verbunden sind. 

1 5 Vorteilhafte Regulationssequenzen fur das neue Verfahren liegen beispielsweise In 
Promotoren vor, wie dem cos- tac-. trp-, tet-, trp-tet-, Ipp-, lac- Ipp-lac-, laclq-. T7- 
. T5-, T3-, gal-, trc-, ara-, SP6-. A-PR- oder A-PL-Promotor und werden vorteilhaft- 
erwelse in Gram-negativen Bakterien angewendet. Weitere vorteilhafte Regulationsse- 
quenzen liegen beispielsweise in den Gram-posltiven Promotoren amy und SP02. in 

20 den Hefe- oder Pilzpromotoren ADC1 , MFa. AC, P-60, CYC1 . GAPDH, TEF, rp28! 
ADH Oder in den Pflanzenpromotoren CaMV/35S [Franck et a!., Cell 21 (1980) 285- 
294], PRP1 [Ward et al.. Plant. Mol. Biol. 22 (1993)], SSU, OCS, Iib4, usp, STLS1, 
B33, nos Oder im Ubiquitin- oder Phaseolin-Promotor vor. In diesem Zusammenhang 
vorteilhaft sind ebenfalls induzierbare Promotoren, wie die in EP-^A-O 388 186 (Ben- 

25 zylsulfonamid-induzierbar). Plant J. 2, 1992:397-404 (Gatz et al., Tetracyclin- 

induzierbar), EP-A-0 335 528 (AbzisinsSure-induzierbar) oder WO 93/21334 (Ethanol- 
oder Cyclohexenoi-induzlerbar) beschrlebenen Promotoren. Weitere geeignete Rlan- 
zenpromotoren sind der Promolor von cytosollscher FBPase Oder der ST-LSI-Promolor 
der Kartoffel (Stockhaus et al., EUBO J. 8, 1989. 2445), der Phosphoribosylpy- 

30 rophosphatamidotransferaserPrpmotor aus Glycine max (Genbank-Zugangsnr 

U87999) Oder der in EP-A-O 249 676 beschriebene nodienspezifische Promotor. Be- 
sonders vorteilhafte Promotoren sind Promotoren. welche die Expression in Geweben 
emiogiichen, die an der Fettsaurebiosynthese beteiligt sind. Ganz besonders vorteilhaft 
sind samenspezifische Promotoren, wie der ausfQhrungsgemaBe USP Promotor aber 

35 auch andere Promotoren wie der LeB4-. DC3, Phaseolin- oder Napin-Promotor. Weite- 
re besonders vorteilhafte Promotoren sind samenspezifische Promotoren, die fQr mo- 
nokotyle oder dikotyle Pflanzen venwendet werden kdnnen und in US 6,608,152 (Na- 
pin-Promotor aus Raps), WO 98/45461 (Oieosin-Promotor aus Arobidopsis), US 
5,504,200 (Phaseolin-Promotor aus Phaseolus vulgaris), WO 91/13980 (Bce4- 

40 Promptor aus Brassica), von Baeumlein et al.. Plant J., 2, 2, 1 992:233-239 (LeB4- 
Promotor aus einer Leguminose) beschrieben sind, wobei sioh diese Promotoren fur 
Dikotyiedonen eignen. Die folgenden Promotoren eignen sich beispielsweise fQr Mono- 
kotyledonen lpt-2- oder lpt-l-Promotor aus Gerete (WO 95/15389 und . 
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WO 95/23230). Hordein-Prpmotor aus Gerste und andere, in WO 99/16890 beschrie- 
bene geeignete Promotoren. 

, Es ist im Prinzip moglich, alle natQrIichen Promotoren mit Ihren Regulatronssequenzen. 
^.»,», ^'^ genannten, fur das neue Verfahren zu verwenden. Es Ist ebenfalls meg- ' 
5 lich und vortellhaft, zusatzlich oder alleine synthetische Promotoren zu venwenden, 

besonders wenn sie eine Samen-spezifische Expression vennittein, wie z.B. besclirle- 

ben in VyO 99/16890. 

Urn einen besonders holien Gehalt an PUFAs vor allem in transgenen Pflanzen zu 
erzielen, sollten die PUFA-Biosynthesegene vortellhaft samenspezifiscli In Oisaaten 

10 exprimiert werden. Hierzu konnen Samen-spezifische Promotoren venwendet werden, 
bzw. solche Promotoren die Im Embryo und/oder im Endosperm aldiv sind. Samen- 
spezifische Promotoren l<6nnen prinziplell sowohl aus dikotolydonen als auch aus mo- 
nokotolyflonen Pflanzen isoliert werden. Im folgenden sind vorteilhafte bevorzugte 
Promotoren aufgefQhrt: USP (= unknown seed protein) und Vicilin (Vicia faba) [Baum- 

15 lein et lal., Mol. Gen Genet., 1 991 , 225(3)], Napin (Raps) [US 5.608,152], Acyi-Carrier 
Protein (Raps) [US 5.315,001 und WO 92/18634], Oleosin (Arabidopsis thaliana) [WO 
98/45461 und WO 93/20216], Phaseolin (Phaseolus vulgaris) [US 5.504.200], Bce4 
[WO 91/13980], Uguminosen B4 (LegB4-Prbmotor) [BSumleln et al.. Plant J 2 2 
1992], Lpt2 und Ipti (Gerste) [WO 95/15389 u. WO95/23230], Samen-spezHlsche Pro- 

20 motoren aus Reis, Mais u. Weizen [WO 99/1 6890], Amy32b. Amy 6-6 und Aleurain [US 
5.677,474], Bce4 (Raps) [US 5,530,149]. Glycinin (Soja) [EP 571 741], Phosphoenol- 
Pyruvatcarboxylase (Soja) [JP 06/62870]. ADR12-2 (Soja) [WO 98/08962], Isocltiatlya- 
se (Raps) [US 5,689.040] oder a-Amylase (Gerste) [EP 781 849]. 

Die Pflanzengenexpression ISsst sich auch Qber einen chemisch induzierbaren Promo- 
25 tor erfeichtem (siehe eine Obersicht in Gatz 1997, Annu. Rev. Plant Physiol. Plant Mol. 
Bfol., 48:89-108). Chemisch induzierbare Promotoren elgnen sich besonders, wenn 
gewunscht wird. dass die Genexpression auf zeitspeziflsche Weise erfoigt. Beispiele 
fur solche Promotoren sind ein Salicylsaure-induzlerbarer Promotor (WO 95/19443) 
ein Tetracyclln-induzlerbarer Promotor (Gatz et al. (1992) Plant J. 2. 397-404) und ein 
30 Ethanol-induzierbarer PromotoK 

Urn eine stabile Integration der Biosynthesegene in die transgene Pflanze Qber mehr©- 
re Generation sicherzustellen, sollte jede der im Verfahren verwendeten NukleinsSu- 
ren. die fflr die Acyl-CoA:Lysophospholipid-Acyltransferase.die vorteilhafte A-4- 
Desaturase, die A-5-Desaturase. die A-6-Desaturase, die A-8-Desaturase und/oder die 

35 A-5-Elongase, die A-6-Elongase und/oder die A-9-Elongase codieren, unter der Kon- 
trolle eines elgenen bevorzugt eines unterschiedlichen Promoters exprimiert werden, 
^ da sich wiederholende Sequenzmotive zu Instabilitat der T-DNA bzw. zu Rekombinati- 
onsereignissen fQhren kSnnen. Die Expressionskassette ist dabei vortellhaft so aufge- 
baut,' dass einem Promotor eine geeignete Schnittstelle zur Insertion der zu expremier- 

40 enden Nukleinsaure folgt vortellhaft in einem Polylinker anschlieBend gegebenenfalls 
ein Terminator hinter dem Polylinker liegt. Diese Abfolge wiederholt sich mehrfach be- 
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itiSglich mehrers NuMeinsSuresMusn^on hi„tr^ erminator. Es ist aber auch 

nert sein, ohne dass dadurch die Exorassinn ?!r "^asselfe inse- 

dar USP- LaaB4 odsr i^^ll:. w Jf^ ™ Promotoren vWs belspielsweise 
we«len. W^^^^j^T^^^llS^f '^^^ Tam,inatofan verwendet 

15 0.s^„niadoohzu:^Sr:^^b^r;"nS^^ 

Temilnator. WIe auch for die PmZ^ t^T^ ^ ®" "^"^ «<" OCSI 

0 TenBinatoreaquen^rniLi^It^^lC^: ""'"Nedas Gen unte«cWedlloha 

organismen RegubC^a^,SeTe «M^;S' Re^l^^ '^'^ 
welche durch ihre EnzymakWita in di» r^. .S^™ ' "®P™ssoren Oder Enzyme, 

■> «osyn«,ese^,sein2:;tn^tg^^,n^,^^ 

nan heterologBn odar homologan UraminsB Min WpTJiST ''^^ 
leinsaurelconslrukt taw. Qenlmnsln^^^^ Werterhin konnen vorteilhaft im Nuk- 

Upidstoffwecl,sels SaSiTS^Sl^'T^T^"* «^ 
Oder mehreren ^T^X^"^, ^^JZC'^!:' 
synlhesegene des Fettsfcire- Oder UDidstoZfio^ItT Vorteilhaft werden als Bio- 

der Gaippe AcyMJoA-DehydCniSnt^S- a'L ^ 
Desatutase(n) AcuI-acp Thi^LfT^ , '^'^'^1= ^ <»mer protein]- 

Syn*ase(nrFe^Su;:^Z«,t^S'?^r^ 
Coenzym A-Oxidase<n) Fett^r^JlL^rT^ A-Carboxyla8e<n), Acyl- 

senas^n, Trlacylgly^roli^en^i'^^^ Fettsaura-Acetylanasan. Upoxy^ 
Fettsaure-aonoaLXter^^^^f;!^'"''^^^ HydroparoxlcH.yasan Oder 

Nuk,einsSu,ese?^1^;XS^ Ta'p^r^'- 
ausgewahit aus der Gmppe der^ToS^a 1 bTT' «^i*W»to«»«*eals 

Oder A-9-Bongase. oesafurase-, A*-Elongase-, A-e-Bongaae- 
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Dabei konnen die vorgenannten Desaturasen in Kombination mit anrior^n n 
^_ Die regulatorischen Sequenzen bzw. Faktoren kdnnen dabei wie oh^n ho..*, • ^ 

Acyltrarisferasen codieren, oderein NiMemsSnrta,nnJr.,J* 
ausflben, umfassen. Ferner soil der e^nriff veworen, die ahnliche Funkbonen 
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funktionsfahig verbunden ist, umfasst. In einem rekombinanten Expressionsvektor be- 
deutet "funktionsfahig verbunden". dass die Nukleotidsequenz von Interesse derart an 
die Regulatk)nssequen2(en) gebunden Ist, dass die Expression der Nukleotidsequenz 
.nfidglich ist und sie aneinander gebunden sind, so dass beide Sequenzen die vorfier- 
gesagte, der Sequenz zugesciiriebene Funktion erfullen (z.B. in einem In-vitro- 
Transkrlptlons-/T ranslationssystem oder in einer Wirtszelle, wenn der Vektor in die 
Wirtszelle eingebracht wird). Der Begriff "Regulatlonssequenz" soli Promotoren En- 
hancer und andere Expresslonskontrollelemente (z.B. Polyadenylieaingssignale) um- 
fassen. Diese Regulationssequenzen sind z.B. beschrieben In Goeddel: Gene Expres- 
sion Technology: Methods in Enzymology 185, Academic Press, San Diego, CA 
(1990), Oder siehe: Gruber und Crosby, in: Methods in Plant Molecular Biology and 
Blotechnolgy, CRC Press. Boca Raton, Florida. Hrsgb.: Glick und Thompson, Kapitel 7 
89-108, einschlieBlfch der LIteraturstellen darin. Regulationssequenzen umfassen sol- ' 
Che, welche die konstitulive Expression einer Nukleotidsequenz In vielen Wirtszelltypen 
steuern, and solche, welche die direkte Expression der Nukleotidsequenz nur in be- 
sammten Wlrtszellen unter bestimmten Bedingungen steuern. Der Fachmann weiB 
dass dib Gestaltung des Expressionsvektors von Fakloren, wie der Auswahl der zu 
transfomiierenden Wirtszelle, denn AusmaB der Expression des gewQnschten Proteins 
usw., abhangen kann. 

Die venwendeten rekombinanten Expresslonsvektoren konnen zur Expression von A- 
cyl-CoA:Lysophospholipid-Acyltransferasen, Desaturasen und Bongasen in prokaryo- 
tischen oder eukaryotischen Zellen gestaltet sein. Dies ist vortellhaft, da hSuflg Zvw- 
schenschritte der Vektorkonstruktion der Einfachheithalber in Mikroorganlsmen durch- 
gefuhrt werden. Beispielsweise konnen AcyI-CoA:Lysophospholipid-Acyltransferase- 
Desaturase- und/oder Hongase-Gene In bakterlellen Zellen, Insektenzellen (unter ' 
Verwendung von Baculovirus-Expressionsvektoren), Hefe- und anderen PBzzellen 
(siehe Romanes, M,A., et al. (1992) "Foreign gene expression In yeast: a review" 
Yeast 8:423-488; van den Hondel. C.A.M.J J., et ai. (1991) "Heterologous gene ex- 
pressfon in filamentous fungr, In: More Gene Manipulations in Fungi. J.W Bennet & 
LL. Lasure, Hrsgb., S. 396-428: Academic Press: San Diego; und van den Hondel 
C.A.M.J.J., & Punt, P.J. (1991) "Gene transfer systems and vector development for 
filamentous fungi, in: Applied Molecular Genetics of Fungi, Peberdy, J.F et al Hrsgb 
S. 1-28, Cambridge University Press: Cambridge), Algen (Falciatore et al., 1999 Ma- 
rine Biotechnology. 1, 3:239-251), Clliaten der Typen: Holotrichla. Perltrlchia, Spirotri- 
chia, Suctona.Tetrahymena, Paramecium, Colpidium. Glaucoma, Platyophrya Poto- 
macus, Desaturaseudocohnilembus. Euplotes, Engelmanielia und Stylonychia'insbe- 
sondere der Gattung Stylonychia lemnae. mit Vektoren nach einem Transform'ations- 
verfahren, wie beschrieben In WO 98/01572, sowie bevorzugt in Zellen vielzelliger 
Pflanzen (siehe Schmidt. R. und Willmitzer. L (1988) "High efficiency Agrobacterium 
tumefaciens-mediated transformation of Arabidopsis thallana leaf and cotyledon ex- 
plants? Plant Cell Rep.:583-586; Plant Molecular Biology and Biotechnology C Press 
Boca Raton, Rorida. Kapitel 6/7. S.71-1 19 (1993); F.F. White, B. Jenes et al., Tech- ' 
niques for Gene Transfer, In: Transgenic Plants, Bd. 1, Engineering and Utilization 
Hrsgb.: Kung und R. Wu, Academic Press (1993), 128-43; Potrykus, Annu. Rev. Plant 
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Physiol. Plant Molec. Biol. 42 (1991), 205-225 (und darin zitierte Literaturstellen)) 
exprlmiert werden. Geeignete Wirtszellen warden ferner erortert In Goeddel, Gene Ex- 
pression Technology: Methods In Enzymology 185, Academic Press, San Diego, CA 
.(1990). Der rekomblnante Expressionsvektor kann altematlv. zum Beispiel unter Ver- 
wendung von TT-Promotor-Regulatlonssequenzen und T7-Polymerase, in vitro transk- 
ribiert und transiatiert werden. 

Die Expression von Proteinen in Prokaryoten erfolgt melst mit Vektoren, die konstitutl- 
ve Oder induzierbare Promotoren enthalten, welche die Expression von Fusions- Oder 
nicht-Fusionsproteinen steuern. Typische Fusions-Expressionsvektoren sind 
u.a, pGEX (Pharmacia Biotech Inc; Smith, D.B., und Johnson, K.S. (1988) Gene 67 31- 
40), pMAL (New England Bfolabs. Beverly, MA) und pRlT5 (Phannacia, Piscataway 
NJ). bei denen Glutathion-S-Transferase (GST), Maltose E-bindendes Protein bzw. ' 
Protein A an das rekomblnante Zielprotein fusioniert wrd. 

r 

Beispiele fur geeignete induzierbare nicht-Fusions-E. coll-Expressionsvektoren sind 
u.a. pTfc (Amann et al. (1988) Gene 69:301-315) und pET lid (Studler et al.. Gene 
Expression Technology: Methods in Enzymology 185, Academic Press, San Diego 
Kalif omien (1 990) 60-89). Die Zielgenexpression vom pTrc-Vektor beruht auf der 
TransKription durch WIrts-RNA-Polymerase von einem Hybrid-trp-iac-Fusionspromotor 
Die Zielgenexpression aus dem pET lld-Vektor beruht auf der Transkriplion von ei- 
nem T7-gn10-lac-Fusions-Promotor, die von einer coexprlmierten viralen RNA- 
Polymerase (T7 gnl) vemnittelt wird. Diese virale Polymerase wird von den WirtsstSm- 
men BL21 (DE3) Oder HMS174 (DE3) von einem residenten A-Prophagen bereitge- 
stellt, der ein T7 gnl -Gen unter der Transkriptionskontrolle des iacUV 5-Promotors 
birgt 

Andere in prokaryotlschen Organlsmen geeignete Vektoren sind dem Fachmann be- 
kannt, diese Vektoren sind beispielsweise in E. coli pLG338, pACYC184, die pBR- 
Reihe, wie pBR322, die pUC-Reihe. wie pUCl8 Oder pUC19. die M113mp-Reihe 
pKC30. pRep4, pHSI, pHS2, pPLc236, pMBL24, pLG200, pUR290, pIN-llll 13-61 ', 
Agtl 1 or pBdCI, in Streptomyces plJIOI , plJ364, plJ702 Oder piJ361 , in Bacillus 
pUB1 10, pC194 Oder pBD214, in Corynebacterium pSA77 Oder pAJ667. 

Bei einer weiteren Ausfuhmngsfomn ist der Bcpressionsvektor ein Hefe-Expressions- 
vektor. Beispiele fur Vektoren zur Expression in der Hefe S. cerevisiae umfassen pYe- 
Desaturasecl (Baldari et al. (1 987) Embo J. 6:229-234), pMFa (Kurjan und Herskowitz 
(1 982) Cell 30:933-943). pJRY88 (Schultz et al. (1987) Gene 54:1 13-123) sowie 
pYES2 (Invitrogen Corporation, San Diego. CA). Vektoren und Verfahren zur Konstru- 
klion von Vektoren, die sich zur Venwendung in anderen Pilzen, wie den filamentdsen 
Pilzen, elgnen, umfassen diejenigen, die eingehend beschrieben sind in: van den Hon- 
del, C.A.M.J.J.. & Punt. P.J. (1991) "Gene transfer systems and vector devetopment for 
filamentous fungi, in: Applied Molecular Genetics of fungi, J.F. Peberdy et al., Hisgb 
8. 1-28, Cambridge. University Press: Cambridge, Oder In: More Gene Manipulations 'in 
Fungi [J.W. Bennet & L.L Usure, Hrsgb., S. 396-428: Academic Press: San Diego]. 
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p^y^^^ Hefevektoren sind beispielsweise pAG-l. YEpe, YEpia Oder 

Atemativ^nen He AcyRSoA-Lysophospholipid-Acyftransfeiasen Desaturasen 
und/oder Etongaeen In Inseklenzellen unter VerwendLng «,n ^iovi^S^ 

IZ^- ci,d'Sa^;^*r r "^"^ '^<-'<^- A Manual, 

Phospholipid-Acyltransferasen, DesaUirasen un^oder Bongasen h et^i^ PBan 

Ml und dann 2rt»rte Ueratucangaben. und Pflanzenzellen aus haherenwJmzSfe B 
Speirnattphyten. wie FeldfrOchten) exprtmlert warden. Belspiele WrXiST ' 
ExpressBnsvekfcxen umfassen solche, die eingehend bescS*^ STLoker D 
^^fl^*^' ' 1- <1992> -New plant bl.«^S«!XJ^' 

vorzugswerse Regulationssequenzen wel 

J. 3 (1984) 835ff.) Oder funktionelle Aquivalente davon, aber auch aile ^d^r^n in 
Rianzen funWfonell aktiven Terminatoren sind geelgnet " 
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^r^NA-Verhaltnls erhoht. enthSIt (Gallie et al.. 1987. Nucl. Acids Research 15:8693- 

, Die Pflanzengenexpression-muss wie oben beschrieben funktionsfahia mit einem «o 
eigneten Promotor verbunden sein. der die Genexpresslorauf r^StS^^^^^^ 
gewebe^ezmsche Weise durchfuhrt. Nutzbare PrLotoren sind^SSSe^^^;^^^^ 

• S'r^l^Tss^^^^^^^ ^ieJenigen.'cJe"r2:^an^^^^^^ 
stammeo. wie 35S CAMV (Franck et al.. Cell 21 (1980) 285-294) 19S raMV ^cioh^ 

US 4.962,028 beschnebene der kJeinen Unterelnheit der Rublsco. 

10 Andere bevorzugte Sequenzen fflr die Verwendung zur funkbonsfahlgen Verblnduna in 
PHan^ngenexpressions-K^^^^ 

Genp oduktes m sein entsprechendes Zellkompartiment notwendig sindV^ehe efne 
Ubersicht m Kermode, Crtt Rev. Plant Sol 15 4 n99e> 2fts Ao^^rTn ^ ! f • 
raturstellen). beispielsvweise in die Vakuote den zIlSi «t f 1^^^^ o? ^'*'!''^ 
15 Amyioplasten, Chloroplasten, ChromX^rde^^Sr 1^^^^^^^ ^« 

K^T^.^.^TT''^^^''''' ^'"^^^ Pe Js^men und a^e^ 

Kompartimente von Pf ianzenzellen. 

Die Pflanzengenexpression l§sst sich auch wie oben beschrieben Ohpr ainon ^h^«, ««u 
induzierbaren Promotor erielchtem (siehe eine Ubersicmn Gate iS^Zu Rev 

SK^h besonders wenn gewQnscht wird. dass die Genexpression auf zeCSis^S^ 
We.se erfolgt^Beisplele fQr solche Promotoren sind ein Sallcylsaure-lnSerb^er 
Promotor (WO 95/19443). ein Tetracyclin-induzierbarer ProSotor (Gate eU^^^^^ 
Plant J. 2, 397-404) und ein Ethanol-induzierbarer Promotor. ^ ^ 

25 Auch Promotoren. die auf biotische Oder abfotische Stressbedingungen reaaieren sind 

statmndet, in Samenzelten, wie den Zellen des Endospemi imd des^^^^n 
"^i '^^^^e^^T^^ ""^ «' ^- <3«" Genet, 

erassica (WO 91/13980) oder der Legumin-B4-Promotor (LeB4- Bapumioin ^ 
1992, Plant Joumel. 2 (2)333-9) sowie Promotoren S^dte'^^CXn'; Ex 

nertjertuhren. Geeignete beachtenswerte Promotoren sM der Ipl2- oc^lptl-Gen- 
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Promotor aus Gerste (WO 915/15389 und WO 95/23230) Oder die in WO 99/16890 be- 
scliriebenen (Promotoren aus dem Gersten-Hordein-Gen, dem Reis-Glutelin-Gen, dam 
Reis-Oryzin-Gen, dem Reis-Prolamln-Gen, dem Weizen-GIiadin-Gen, Weizen-Glutelln- 
Gen, dem Mais-Zeln-Gen, dem HafeNGIutelin-Gen, dem Sorghum-Kasirin-Gen, dem 
5^.iX Roggen-Secalin-Gen). 

Insbesondere kann die multiparallele Expression der im Verfaliren venwendeten Acyl- 
• CoA:LysQphosphoIipid-Acyltransferasen allein Oder In Kombinatlon mit Desaturasen 
und/oder Elongasen gewQnscht sein. Die Einfulirung solcher Expressionsl<assetten 
l<ann Qber eine simultane Transformation mehrerer einzelner Expressionskonstrukte 
10 erfolgen Oder bevorzugt durch Kombinatlon mehrerer Expresslonskassetten auf einem 
Konstrukt. Auch konnen mehrere Vekloren mit Jewells mehreren Expresslonskassetten 
transformlert und auf die Wirtsroile ubertragen werden. 

Ebenfalls,besonders geeignet sind Promotoren, welche die plastldenspeziflsche Ex- 
pression herbeifOhren, da PlasBden das Kompartlment sInd, In dem die VoriSufer sowie 
15 einige Endprodukte der Lipldblosynthese synthetisiert werden. Geeignete Promotoren. 
wie der virale RNA-Polymerase-Promotor, sind besclirleben In WO 95/16783 und Wo' 
97/06250, und der cIpP-Promotor aus Arabidopsis, beschrleben in WO 99/46394. 

Vektor-DNA ISsst sich in prokaryotlsche oder eukaryotisolie Zellen Qber heikSmmliche 
Transformations- Oder Transfektionstechniken einbringen. Die Begrlffe Transfonnati- 

20 on" und Transfektion", Konjugatlon undTransduktlon, wIe hier venwendet, sollen eine 
VIelzahl von Im Stand der Technik bekannten Verfahren zum Einbringen fremder Nuk- 
leinsaure (z.B. DNA) in eine WIrtszelle. einschlieBlich Galclumphosphat- Oder Calclum- 
chlorid-Coprazipitatlon, DEAE-Dextran-vermittelte Transfeklion, LipofekHon, natOrli- 
che Kompetenz, chemisch vermittelter Transfer, Elektroporatlon Oder Teilchenbe- 

25 schuss. umfassen. Geeignete Verfahren zur Transfonnatlon oder Transfeklion von 
WIrtszellen, einschlieBlich Pflanzenzellen, lassen sIch finden in Sambrook et al. (Mo- 
lecular Cloning: A Laboratory Manual., 2. Auf!., Cold Spring Harbor Laboratory, Cold 
Spring Harbor Laboratory Press, Cold Spring Harbor, NY, 1989) und anderen Labor- 
Handbuchern, wIe Methods in Molecular Biology, 1995, Bd. 44, Agrobacterium proto- 

30 cols, Hrsgb: Gartland und Davey, Humana Press, Totowa, New Jersey. 

WIrtszellen, die Im Prinzip zum Aufnehmen der erf indungsgemaBen Nukleinsaure, des 
erfindungsgemSBen Genproduktes Oder des erfindungsgemaBen Vektors geeignet 
sind, sind alle prokaryotischeh Oder eukaryotlschen Organismen. Die vortellhaftenweise 
verwendeten Wirtsorganismen sind Mikroorganlsmen, wie Pilze Oder Hefen oder Pflan- 

35 zenzellen vorzugsweise Pflanzen oder Telle davon. Plize, Hefen oder Pflanzen werden 
vorzugswelse venwendet, besonders bevorzugt Pflanzen, ganz besonders bevorzugt 
^ Pflanzen, wie Olfruchtpflanzen. die groSe Mengen an Lipidverbindungen enthalten, wie 
Raps, Nachtkerze, Hanf, DIestel, Eidnuss, Canola, Lein, Soja. Safflor, Sonnenblume 
Borretisch, oder Pflanzen, wie Mais, Welzen, Roggen. Hafer, Tritlcale. Rels, Gerste, ' 

40 Baumwolie, Manlok, Pfeffer, Tagetes, Solanaceen-Pflanzen, wie Kartoffel, Tabak, Au- 
bergine und Tomate, Vicia-Arten, Erbse, Alfalfa, Buschpflanzen (Kaffee, Kakao, Tee) 
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Salix-Arten, Baume (Olplame, Kokosnuss) sowie ausdauernde Graser und Futlerfeld- 
fruchte. Besonders bevorzugte erfindungsgemaee Pflanzen sind Olfruchtpflanzen, wie 
Soja, ErdnuS, Raps, Canola, Lain, Hanf, Nachtkerze, Sonnenblume, Safflor, Baume 
. (dipaime, KokbsnuB). 

Ein weiterer erfindungsgem§6er Gegenstand sInd wie oben beschrieben Isolierte Nuk- 
leinsauresequenzen, die fOr Polypeptide mit Acyl-CoA:Lysophosphollpld- 
Acyltransferaseaktivltat codierern wobei die durch die NuklelnsSuresequenzen codier- 
ten Acyl-CoA:Lysophospholipid-Acyltransferasen spezifisch Cie-. Cis-, C20- Oder Czr 
Fettsauren mit mindestens einer Doppelblndungen Im Fettsauremolekul umsetzen. 

Vortellhafte Isolierte NuWelnsSuresequenzen sInd Sequenzen ausgewahft aus der 
Gruppe: 

d) ^iner NuklelnsSuresequenz mit der In SEQ ID NO: 1 , SEQ ID NO: 3, SEQ ID 
, NO: 5 Oder SEQ ID NO: 7 dargestellten Sequenz, 

e) ' NukleinsSuresequenzen, die sich als Ergebnis des degenerierten genetischen 

Codes von der In SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5 Oder SEQ ID 
NO: 7 enthattenden codierenden Sequenz ablelten lassen 

f) Derl>«te der in SEQ ID NO: 1 , SEQ ID NO: 3. SEQ ID NO: 5 Oder SEQ ID NO: 
7 dargestellten Nuklelnsauresequenz, die fur Polypeptide mit der in SEQ ID 
NO: 2. SEQ ID NO: 4, SEQ ID NO: 6 Oder SEQ ID NO: 8 dargestellten Amino- 
sauresequenz codieren und mindestens 40 % Homologie auf Amlnosaureebe- 
ne mit SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6 Oder SEQ ID NO: 8 auf- 

weisen und eine Acyl-CoA:Lysophospholipid-Acyltransferaseaktivltat aufwei- 
sen. 

Die oben genannte erfindungsgema3en NuklelnsSuren stammen von Organismen, wie 
Tieren, Cillaten, PHzen. Pflanzen wie Algen oder DInoflagellaten. die PUFAs syntheti- 
sieren kdnnen. 

Der Begriff "Nukleinsaure(molekQI)». wie hier venwendet, umfasst in einer vorteilhaften 
Ausfuhrungsfonm zudem die am 3'- und am 5'-Ende des kodlerenden Genbereichs 
gelegene untranslatierte Sequenz: mindestens 500, bevorzugt 200, besonders bevor- 
zugt 100 Nukleotide der Sequenz stromaufwSrts des 5'-Endes des kodlerenden Be- 
reichs und mindestens 100, bevorzugt 50, besonders bevorzugt 20 Nukleotide der Se- 
quenz stromabwSrts des 3'-Endes des kodlerenden Genbereiclis. Ein "isoliertes" Nuk- 
leinsauremolekul wird von andereri NukleinsauremolekQIen abgetrennt, die in der na- 
tOrlichen Quelle der Nukleinsaure vorliegen. Eine "isolierte" Nukleinsaure hat vorzugs- 
weise keine Sequenzen, welche die Nukleinsaure in der genomischen DNA des Orga- 
nismus, aus dem die Nukleinsaure stammt, natOrliclienweise flankieren (z.B. Sequen- 
zen. die sich art den 5'- und 3'-Enden der Nukleinsaure beflnden). Bei verschiedenen 
AusfQIirungsformen kann das isolierte Acyl-CoA:Lysophosphollpid- 
Acyltransferasemoiekul zum Beispiel weniger als etwa 5 kb. 4 kb, 3 kb, 2 kb, 1 kb, 0,5 
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Die im^Verfahren verwendeten NukleinsauremoIekfliP t r cAr. m .i i^- ~ 

boratcy PrL. Cold SpnYTHa^r W TJSf^,^"*^' ^ 

gleichen Sequenz erstellt worden sind). 2um Beisoiel ISsst si^h mPM a t in 
Mn^nof M, V 18:5294-5299) und cDNA mittels Reverter TranskrtoSf" B 

ID NO-^ tpn = ■ ? H"™*8fe zu emer In SEQ ID NO- 1 SEQ 

ID NO. 3. SEQ ID NO: 5 Oder SEQ ID NO: 7 gezeigten Nuldeotidsequen»„ o^;r iSn 
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te^n^ ?r^m \ uT^*^" Weiterhfn sfnd isollerte Nuk- 

MnTcS? Nukleotidsequenz. die an eine der in SEQ ID NO- 1 SEqTd 

.Te davon hybndlsieren. 2.B. unter stringenten Bedlngungen hybridisierL ^lei^h^^ 

Tr. K^^' Substitution von Nukleotiden aus/in der in SEQ ID NO- 1 SEQ ID NO 3 
f Ai^-^H^i T ^^"^ ^ <^^^9«^tellten Sequenz erhalten laien^^^^^ 
• d'e Abs|cht ,st. dass die Enzymaktivitat der davon herrOhrenden syntheSerterpSe 

10 ri """IT '"^'^"^^^ ^^"^ vorteilhafterwelse bSSen v^,^ 

S;«ntr' ""^"^^^^^'^^ ^"-'t^t Acy|.CoA:LysophosphoIipid 
Acyltransferase besitzen. das heiBt deren Aktivitat im wesentHchen nicht reduziert i.,t 

30 %, ganz besonders bevorzugt 40 % der uraprunglfchen EnzymakHvitat vemiirhln 
1S renr,:l^° no: SEQ ,0 no: 3. SEQ ?0 NO: S T^'^j^^ " 

Homologen der SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5 Oder SEQ ID NO- 7 be- 
deuten be.spielswelse auch bakterlelle. Pilz- und Pflanzenhomologen! ve^oSe S^ 

20 Homologen d^^ SEQ ID NO: 1. SEQ ID NO: 3. SEQ ID NO: 5 Oder SEQ ID NO- 7 be- 
deutet auch Denvate. wie beispielsweise Promoton^arianten. Die Promotoren^rom^ 
au^^arte der angegebenen Nukleotldsequenzen konnen durch einen odS meSe°e 
Nukleotidausteusche. durch Insertlon(en) und/oder Deletlcn(en) moSffl^^rt werden 
ohne dass jedoch die Funktionalitat Oder Aktivitat der Prornotoren aeS 1^ £ 

?c:!:s::s™in" 

Die vorgenannten NuMernsiuren und ProteinmolekOle mit Acyl-OoALvsoDhosDholtold 

von PUFAs in transgenen Organismen vorteilhaft in Pflanzen, wie IMais Weta^TT 
gen. Hafer. T«cale, Reis. Gerste, Splabohne. Ertnuss. Bau^^irunum A^";^ 
61- Oder Faseriein, Brasslca-Arten. »le Raps, Canola u^d RObsen wSrs^ner 
5 blume. Borretsch. Nachtkerze und Tagetes. Sbianacaen-PII^SJjSSS Ta- 
^ ^bergine und Tomate. Vloia-Arten, Erbse, l«anlok, AlfaSa. ^s.^Xa^'(^- 

S;,^FL2Si^'::r"' ^ '^"^^ undausda'ZrnS 

^ . sem und FutterteWWcMen, entweder direkt (z.B. wenn die Oberemresslon Oder Odii 

m«n;ng e.nes Feltsaureblosymhese-Prateins einen direkten BnflSI a^ cJe^Se 

men l«t) venwndet undA,der kflnnen eine Indlrekt Ausvrfrkung haben aedenSL 
einer Steigening der Ausbeute. ProdukUon un^oder Hfizienz der PrSlu,^ d^lT 
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FAS Oder einer Abnahme unerwunschter Verblndungen fOhrt (2.B. wenn die Modulation 
des Stoffwechsels von Uplden und Fettsauren. Cofaktoren und Enzymen ^ Vert^r 
mngen der Ausbeute, ProdukHon und/oder Effizienz der Produktion^er der Zusam 
^nensetzung der gewunschten Verbindungen innerhalb der Zellen fOhrt wa^^PHtn-m 
die Produkfion eIner Oder mehrerer FetJuren beelnflussen ten^^^^^ 

Die Kombination verschledener Voriaufemnolekiile und Blosyntheseenzvme fiihrt ^..r 
• Herstellung verschledener FettsauremolekOle, eine ents'S^^^en^^^^^^^^ 
d e Zusammensetzung der Uplde hat. Da mehrfach ungesSttlgte FettsaurenT pSfa^ 
n.cht nur einfach In Triacylglycerin sondern auch In MembranlKleXrut we,^^^^^ 

Die Lipldsynthese ISsst sich In zwel Abschnltte unterteilen: die Synthese von Fettsau 
ren und jhre BIndung an sn-GIycerin-S-Phosphat sowie die AddltCoder ModtfS^^^ 
einer polaren Kopfgruppe. Ubifche Uplde, die In Membranen venA^endet weSlr^^m 
fessen Pbosphohplde. Glycollplde. Sphlngollplde und Phosphoglycerlde 7le FettsL 
resyn hese beglnnt mit der UmwandlUng von Acetyl-CoA In MaFoVc^A durch d^^^ 
Acetyl-CoA-Carboxylase Oder in Acetyl-ACP durch die Acetyltran JaXe r^^Sh ler 

ACrcl^sTerein^^^^ •^-<^"'<t-olekQte zusamm^Ac^S::^^^ 

ACP das uber eine Reihe von Kondensations-. Reduktions- und Dehydratislerumr 
reaktionen umgewandelt wird, so dass ein gesatUgtes FettsauremoS mrt ^^^^^^^ 
wunschten KettenlSnge erhalten wird. Die Prxxlul^on der unaesSen F^nJnrot 
diesen MolekOlen wird durch speziflsche Desaturasen u^^z^r^^^^^ 
aerob m.ttels molekularem Sauerstoff oder anaerob (bezugl^h der Fet^ 
.n M.I«>organ,srnen slehe F.C. Neidhardt et al. (1996) E. (ill und Salr^e a 
ASI^ Press: Washington. D.C.. S. 612-636 und darin enthaltene LrterSCSen- Len 
geler et aL (Hrsgb.) (1999) Biology of Procaryotes. Thieme: Stutlg^ New York und 
d e enthaftene Literaturstellen. sowIe Magnuson. K.. etal. (1993) f^rSogS Re 
pt^n^^'^l^'T'' Llteratur^ellen). Die so hergesS te^af 

PhosplK)l,p.de gebundenen FettsSuren mussen anschlleBend wieder fMe weitere 
Elongationen aus den Phospholiplden in den FeftsSureCoA-Ester-PoorateriS^rwer 
den D,es emiogllchen die erflndungsgemSBen Acyl-CoA:LysophoXipll 

von den CoA-Estern auf die Phospholiplde Qbertragen. Diese Reaktionsabfolae kann 
gegebenenfalls mehrfach durchlaufen werden (siehe Hgur 10). "^"^ 

^tf dS c' Kohte;^J.Tp'^^^ beispielswelse Olsaure. Unol- und Unolen- 
saure. Diese Cis-Kohlenstoff-Fettsauren mussen auf Cao und Ca, verlSnaert werdPn 
damrt Fettsauren vom Elcosa- und Docosa-Kettentyp eS,alten weS Se 
Verfahren ven«,endeten Acyl-CoA:Lysophosphollpld-Acyltransferasen. ^^rte lhaftin 
^TaTaTI ^-5-. A-6. und A-S-Desaturrsrun^cler 
tntf' ^ ' t®'^'^"^^^® Arachldonsaure. Elcosapentaensaure DocosT- 

pente^nsaure oder Docosahexaensaure sowie verschledene andere iSttiqe PU 
FAS erhalten extrahlert und fOr verschledene Zwecke bel Nahrun^mS 
Kosmetik- Oder phannazeutlschen Anwendungen venA^endet werd^Mtt d^^n;nn. 
ten Enzymen konnen vorzugswelse C.-. C.-. und/oder C^-Fettsauren mfr^l^^^^^^^ 
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zwel vorteilhaft mindestens drei, vier, funf Oder sechs Doppelbindungen im FettsSure- 
molekul, vorzugsweise zu Cao-, und/oder Caa-Fettsauren mit vorteilhaft drei, vier Oder 
fOnf Doppelbindungen Im Fetls§uremolekOI hergestellt werden. Die Desaturlerung kann 
vor Oder nach Elongation der entsprechenden Fetlsaure erfolgen. Daher fuhren die 
§>A Produkte der Desaturaseaktivitaten und der moglichen weiteren Desaturlerung und 
Elongation zu bevorzugten PUFAs mit hoiierem Desaturierungsgrad, einschlieBlich 
einer weiteren Elongation von C20 zu C22-Fettsauren,zu FettsSuren wie Y-LinolensSure, 
• DIhomO'Y-Hnolensaure, ArachldoYis§ure, Stearidonsaure, Eicosatetraensaure Oder Ei- 
cosapentaensaure. Substrate Substrat der Acyl-CoArLysophospholipid- 

10 Acyltransferasen im erfindungsgemSBen Verfahren sind C16-, C18-, C20- Oder Caa- 
Fettsauren wie zum Beispiei PalmitinsSure, Palmitoleinsaure, Linolsaure, y- 
Unolensaure. a-Unolensaure, Dihomo-y-linolensaure, Eicosatetraensaure Oder Steari- 
donsaure. Bevorzugte Substrate sind LinolsSure, y-Linolensaure und/oder a- 
Linolensaure, Dihomo-y-linolensaure bzw. ArachidonsSure, Eicosatetraensaure Oder 

15 Eicosapgntaensaure. Die C18-, C20- pder Caa-Fettsauren mit mindestens zwei Doppel- 
bindungen in der Fettsaure fallen im erfindungsgemaBen Verfahren in Form der freien 
Fettsa6re Oder in Form ihrer Ester beispielsweise in Fomn ihrer Glyceride an. 

Unter dem Begriff "Glycerid" wird ein mit ein, zwei Oder drei Carbonsaureresten ver- 
estertes Glycerin verstanden (Mono-, Di- oder Triglycerid). Unter "Glycerid" wird auch 
20 ein Gemisch an verschiedenen Glyceriden verstanden. Das Glycerid oder das Gylce- 
ridgemisch kann weitere Zusatze, z.B. freie Fettsauren, Antloxidantlen, Proteine, Koh- 
lenhydrate, Vitamine und/oder andere Substanzen enthalten. 

Unter einem "Glycerid" Im Sinne des erfindungsgemaBen Verfahrens werden femer 
vom Glycerin abgeleitete Derivate verstanden. Dazu zahlen neben den oben beschrie- 
25 benen Fettsaureglyceriden auch Glycerophospholipide und Glyceroglycoliplde. Bevor- 
zugt seien hier die Glycerophospholipide wie Lecithin (Phosphatidylcholin), Cardiolipin, 
PhosphaBdylglycerin, PhosphatWylserin und Alkylacylglycerophospholipide beispielhall 
genannt 

Femer mOssen Fettsauren anschlieBend an verschiedene Modifikationsorte transpor- 
30 tiert und in das Triacylglycerin-Speteherllpid eingebaut werden. Ein weiterer wichtiger 
Schritt bei der Upidsynthese ist der Transfer von Fettsauren auf die polaren Kopfgmp- 
pen, beispielsweise durch Glycerin-Fettsaure-Acyitransferase (siehe Frentzen 1998 
Upid, 100(4-5):161-166). 

Veroffentlichungen Qber die Pflanzen-Fettsaurebiosynthese, Desaturierung. den U- 
35 pidstoffwechsel und Membrantransport von fetthaltigen Verbindungen, die Betaoxidati- 

on, Fettsauremodifikation und Cofaktoren, Triacylglycerin-Speicherung und 
^ -AssemWierung eihschlieBlich der LIteraturstellen darin siehe In den folgenden Artikein: 

Wriney, 1997, Genetic Engeneering, Hrsgb.: JK Setlow. 19:149-166; Ohirogge und 

Browse, 1995, Plant Cell 7:957-970; Shanklin und Cahoon, 1998, Annu. Rev Plant 
40 Physiol. Plant Mol. Biol. 49:61 1-641; Voelker, 1996, Genetic Engeneering, Hrsgb.: JK 

Setlow. 18:111-13; Gerhardt, 1992, Prog. Lipid R. 31:397-417; Guhnemann-Schafer & 
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Kindl, 1995, Biochim. Blophys Acta 1256:181-186; Kunau et al., 1995. Prog. Lipid Res. 
34:267-342; Stymne et al., 1993, in; Biocfiemistry and IVIoIecular Biology of Membrane 
and Storage Lipids of Plants, Hrsgb.: Murata und Somerville, Rockville, American So- 
ciety of Plant Physiologists,150-158, Murphy & Ross 1998, Plant Journal. 13(1):1.16. 

Die im Verfahren hergestellten PUFAs, umfassen eine Gnjppe von Molekiilen, die ho- 
here Tiere nicht mehr synthetisleren konnen und somit aufnehmen mQssen oder die 
hShere Tiere nicht mehr ausrelchend selbst herstellen kOnnen und somIt zusatzlich 
aufnehmen mQssen, obwohl sie leicht von anderen Organismen, wie Bakterien, synthe- 
tisiert werden, beispielsweise k6nnen Kalzen Arachidonsaure nicht mehr synthetisle- 
ren. 

Der Begriff " Acyl-CoA:Lysophosphollpid-Acy!transferasen " im SInne der Erfindung 
umfasst Proteins, die am Transfer der an Phospholipide gebundenen Fettsauren in den 
CoA-Ester-Pool und vice versa teilnehmen, sowie ihre Homologen, Derivaten oder A- 
naloga. .Unter Phospholiplden Im Sinrie der Erfindung sind zu verstehen Phosphatidyl- 
cholin, Phosphatidylethanolamin, Phosphatidylserin, Phosphatidylglycerin, und/oder 
Phosphatidylinositol vorteilhaftenweise Phosphatidylcholin. Die Begriffe Acyl-CoA:Lyso- 
phospholipid-Acyltransferase-Nukleinsauresequenz(en) umfassen Nukleinsaurese- 
quenzen, die eine Acyl-CoA:Lysophospholipid-Acyltransferase kodieren und bei denen 
ein Teil eine kodierende Region und ebenfalls entsprechende 5'- und 3'-untranslatlerte 
Sequenzbereiche sein konnen. Die Begriffe ProdukHon oder ProdukHvltat sInd 
im Fachgebiet bekannt und beinhalten die Konzentration des Femiehtationsproduktes 
(Verbindungen der Formel I), das in einer bestimmten Zeitspanne und einem bestimm- 
ten Femientationsvolumen gebildet wird (z.B. kg Produkt pro Stunde pro Uter). Der 
Begriff Efflzienz der Produktion umfasst die Zeit, die zur Erzielung einer bestimmten 
Produktionsmenge ndtig ist (z.B. wie lange die Zelle zur Aufrichtung einer bestimmten 
Durchsalzrate einer Feinchemikalle benStigt). Der Begriff Ausbeute oder Pro- 
dukt/Kohlenstoff-Ausbeute ist Im Fachgebiet bekannt und umfasst die Efflzienz der 
Umwandiung der Kbhienstoffquelle In das Produkt (d.h. die Feinchemllcalie). Dies wird 
gewohnlich beispielsweise ausgedruckt ais kg Produkt pro kg Kohlenstoffquelle. Durch 
ErhShen der Ausbeute oder ProdukHon der Verijindung wird die Menge der gewonne- 
nen MoiekQIe oder der geeigneten gewonnenen MoiekQIe dieser Verbindung in einer 
bestimmten Kultumienge Qber einen festgelegten Zeltraum erhaht. Die Begriffe Biosyn- 
these Oder Biosyntheseweg sind im Fachgebiet bekannt und umfassen die Synthese 
einer Verbindung, vorzugsweise einer organischen Veriaindung, durch eine Zelle aus 
Zwischenverbindungen, beispielsweise in eihem Mehrschritt- und stark regulierten Pro- 
zess. Die Begriffe Abbau Oder Abbauweg sind im Fachgebiet bekannt und umfassen 
die Spaltung einer Vertaindung, vorzugsweise einer organischen Verbindung, durch 
eine Zelle in Abbauprodukte (allgemeiner gesagt, kleinere oder weniger kompiexe Mo- 
lekOle) beispielsweise in einem Mehrschritt- und stari< regulierten Prozess. Der Begriff 
Stoffvxechsel ist Im Fachgebiet bekannt und umfasst die Gesamtheit der biochemi- 
schen Reaktlonen, die In einem Organlsmus stattfinden. Der Stoffwechsel einer be- 
stimmten Verbindung (z.B." der Stoffwechsel einer Fettsaure) umfasst dann die Ge- 
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T^H ^^[^Biosynthe^- Modifikation^ und Abbauwege dieser Verbindung in 
der Zelle, die diese Verbindung betreffen. 

Bei einer weiteren AusfQhrungsfonn kodleren Derivate des erfindungsgemaBen Huu 
Oder SEQ ID NO: 7 Proteine mit mindestens 40 %. vortellhaft etwa 50 bis 60 %vor 
. 7o^^^^l^TfZ\^.^ ^'^^ ^^"^^^ ""'^^^^ mindestens 70 bis 
97 /o, 98 /o 99 ^ Oder mehr Homologle (= identltat) zu einer voIlstSndlgen Aminosau 

Homo^T '^^^k"" ^' ^' '^O: 6 Oder SEQ ?D Na 8 Dte 

Homotog,e wurde uber den gesamten Aminosaure- bzw. NukleinsaureseouenzbPrp^^h 
berechnet FQr die Sequenzverglelche wurde das Programm Sp ^^^^^^^^^ 
Evolution 25. 351-360. 1987. Higgins et al.. CABIOS 5 1^9Vl51-,i^^^^ 
gramme Gap und BestFit [Needleman and Wunsch (J. iviol. Biol 48'^^ (iq7T 
und Smith and Watennan (Adv. Appl. Math. 2; 482-489 (1981 rdfe imG^qo^L 

S^'l^^ll^r^T^'' MS;.tircon^^^ 'us^ " 
TJ^ ^ H ^ T^®" P^*'^"* angegebenen Sequenzhomoloaie- 

werte wurden m.t dem Programm BestFit uber den ges^en Sequen^fch 
genden Einstellungen em,ittelt Gap Weight 8. Len^h SfSghtfl. 

gezeigten NuWeotidsequenzen kodiert wird. 

ZusatzliQh zu den in SEQ ID NO: 1. SEQ ID NO: 3, SEQ ID NO- 5 Oder SEO ID no- y 
gezeigten Acyl-CoA:Lysophosphollpid.Acyltransfe;se.Nukleo«^^^^^^^ ^ 
der Fachmann. dass DNA-Sequenzpolymorphismen. diea. Ande3^^ 

e.ner Population existleren kSnnen. Diese genetlschen Polymorphismen im AcT 
CoArLysophosphoiipid-Acymansferase-Gen k6nnen zwischen IndiXn LtLb 
einer Population aufgrund von natQriicher Variation exfstieren. Die^natar^^^^^^ 
anten bewirken ubiichenweise eine Varianz von 1 hk ^ o, !„ m m " 
Acyl-CoA:Lysophospholipid-Ac,t^^^^^^^ 

tdvanafonen und daraus resultierende Aminosaurepolymoiphismen in ^r^^^^^^^^ 
Se^mSr'^^^^^^^^ clle das Ergebris oaLcher VaSion s ind und 

dPrl r^^^ Acy|.CoA:Lysophospholipld.Acyltransferasen n^it verSn 

dem. soJIen im Umfang der Erfindung enthalten sein. 

FOr das erfindungsgemSBe Verfahren vortellhafte Nuklelnsauremolekiile kCnnen 
auf der Grundlage ihrer Homologle zu den hier offenbarten Acyl 
CoA:LysophosphoIlpid-Acyltransferase.Nukleinsauren unter Vem^endung der Seauen 
zen Oder ernes Tells davon als Hybridisierungssonde gemSB Standard ^ 
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Hybridisierungstechniken unter stringerrten Hybrldisierungsbedingungen isoliertwer- 
den. Dabel kSnnen beisplelsweise isolierte NukleinsauremolekQIe verwendet werden 
die mindestens 1 5 NuMeotide lang sind und unter stringenten Bedingungen mit 
dem NukleinsauremolekQIen, die eine Nukleotidsequenz der SEQ ID NO* 1 SEQ id 
NO: 3.-6EQ ID NO: 5 Oder SEQ ID NO: 7 umfassen. hybridisieren. Es kSnnen auch 
Nukleinsauren mindestens 25, 50, 100. 250 Oder melir Nukleotide venwendet werden 
Der Begriff "hybridlsiert unter stringenten Bisdlngungen", wie hier venwendet. soli Hybri- 
disierungs- und Waschbedlngun^en beschrelben. unter denen Nukleotldsequenzen 
die mindestens 60 % homolog zuelnander sind, gew6hnllch anelnander hybridisierl ' 
bleiben. Die Bedingungen sind vorzugswelse derart. dass Sequenzen, die mindestens 
etwa 65 %, starker bevoizugt mindestens etwa 70 % und noch stSrker bevor- 
zugt mindestens etwa 75 % oder starker zueinander homolog sind, gewolinlich anein- 
ander hybridisierl bleiben. DIese stringenten Bedingungen sind dem Fachmann be- 
kannt und lassen sich in Current Protocols in Molecular Biotogy, John Wiley & Sons, N. 
Y. (1989); 6.3.1-6.3.6., finden. Ein beyorzugtes, nicht einschrankendes Beispiel fOr ' 
stnngente Hybrldisienjngsbedingungen sind Hybridisierungen in 6 x Natriumchlo- 
nd/Natriumcitrat (sodium chloride/sodlumcitrate = SSC) bei etwa 45°C, gefolgt von el- 
nem oder mehreren Waschschritten in 0,2 x SSC. 0.1 % SDS bei 50 bis 65°C Dem 
Fachmann 1st bekannt. dass diese Hybridisiemngsbedingungen sIch je nach dem Typ 
der Nukleinsaure und. wenn beisplelsweise organische Ldsungsmittel vorilegen hin- 
sichtlich der Temperatur und der Konzentration des Puffers unterscheiden. Die Tempe- 
ratur unterscheidet sfch beisplelsweise unter "Standard-Hybridisierungsbedingungen" 
je nach dem Typ der NukleinsSure zwischen 42°C und 58°C in wdssrigem Puffer mit 
einer Konzentration von 0.1 bis 5 x SSC (pH 7.2). Falls organisches Losungsmittel Im 
obengenannten Puffer voriiegt. zum Beispiel 50 % Fomiamid. ist die Temperatur unter 
Standardbedingungen etwa42»C. Vorzugswelse sind die Hybridisierungsbedingungen 
fur DNA:DNA-Hybride zum Beispiel 0.1 x SSC und 20°C bis 45»C. vorzugswelse zwi- 
schen 30*C und 45»C. Vorzugsweise sind die Hybrldisierungsbedingungen fOr 
DNA:RNA-Hybride zum Beispiel 0.1 x SSC und 30»C bis 55»C. vorzugswelse zwischen 
45 C und 55»C. Die vorstehend genannten Hybridlsierungstemperaturen sind bei- 
splelsweise fOr eIne NukieinsSure mit etwa 100 bp (= Basenpaare) Lange und einem G 
+ C-Gehalt von 50 % in Abw6senheit von Formamid bestlmmt Der Fachmann welB 
wie die erforderiichen Hybridisierungsbedingungen anhand von Lehrtjuchem. wie dem 
vorstehend enwahnten oder aus den folgenden Lehrbuchem Sambrook et al "Molecu- 
lar Cloning-. Cold Spring Harbor Laboratory. 1989; Hemes und Higgins (Hrsgb.) 1985 
"Nucleic Acids Hybridization: A Practical Approach". IRL Press at Oxford University ' 
Press. Oxford; Brown (Hrsgb.) 1991. "Essential Molecular Biology: A Practical Ap- 
proach". IRL Press at Oxford University Press, Oxford, bestlmmt werden konnen. 

Zur Bestimmung der prozentualen Homologle (= IdentltSt) von zwel AminosSurese- 
quenzen (z.B. einer der Sequenzen der SEQ ID NO: 2, SEQ ID NO: 4. SEQ ID NO- 6 
od^r SEQ ID NO: 8) oder von zwel Nukleinsauren (z.B. SEQ ID NO- 1 SEQ ID NO- 3 
SEQ ID NO: 5 Oder SEQ ID NO: 7) werden die Sequenzen zum Zweck des optlmalen' 
Verglelchs unterelnander geschrieben (z.B. k6nnen LOcken In die Sequenz eines Pro- 
teins Oder einer Nuklelnsaure elngefOgt werden, urn ein optimales Alignment mit dem 
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anderen Protein Oder der anderen Nukleinsaure zu erzeugen). Die Aminosaurereste 
Oder Nuldeotide an den entsprechenden Aminossiurepositionen oder Nukleotidposltio- 
nen warden dann verglichen. Wenn eine Position in einer Sequenz durch den gleichen 
•Aminosaurerest bder das gleiche Nuldeotid wie die entsprecliende Stelle in der ande- 
5.ir'. ren Sequenz belegt wird, dann sind die MolekQIe an dieser Position homolog (d.h. A- 
minosSure- Oder Nul<leinsaure-''Homoiogie", wie iiier venwendet, entspricht Aminosau- 
re- Oder Nulcleinsaure-'ldentitar). Die prozentuale Homologie zwisclien den beiden 
Sequenzen 1st eine Funktion der Anzahi an identischen Positionen, die den Sequenzen 
gemeinsam sind (d.ti. % Homologie = Amah\ der identischen Positio- 
10 nen/Gesamtanzalil der Positionen x 100). Die Begriffe Homologie und Identitat sind 
damit als Synonym anzusefien. Die venwendeten Programme bzw. Algorithmen sind 
oben beschrieben. 

Ein isoliertes Nukleinsauremolekul, das eine Acy!-CoA:Lysophospholipid-AcyI- 
transferase kodiert, die zu einer Proteinsequenz der SEQ ID NO: 2, SEQ ID NO: 4, 

15 SEQ ID'NO: 6 Oder SEQ ID NO: 8 homolog ist, kann durch Bnbringen einer oder rneh- 
rerer NUkleotidsubsUtuttonen, -additionen oder -deletionen In eine NuWeofidsequenz 
der SEQ ID NO: 1. SEQ ID NO: 3, SEQ ID NO: 5 oder SEQ ID NO: 7 erzeugt werden. 
so dass eine oder mehrere Aminosauresubstjtutionen, -additionen oder -deletionen in' 
das kodierte Protein eingebratht werden. Mutationen konnen in eine der Sequenzen 

20 der SEQ ID NO: 1 . SEQ ID NO: 3, SEQ ID NO: 5 oder SEQ ID NO: 7 durch Standard- 
techniken. wie stellenspezifische Mutagenese und POR-vemnittelte Mutagenese, ein- 
gebracht werden. Vorzugsweise werden konservative AminosSuresubstitutionen an 
einer oder mehreren der vorhergesagten nicht-essentiellen Aminosaureresten herge- 
stellt. Bei einer "konsen/ativen Aminosauresubstitution" wird der AminosSurerest gegen 

25 einen AminosSurerest mit einer ahnlichen Seitenkette ausgetauscht. Im Fachgebiet 
sind Familien von Aminosaureresten mit ahnlichen Seitenketten definlertwowJen. Die- 
se Familien umfassen Aminosauren mit basischen Seitenketten (z.B. Lysin, Arginin, 
Histidin), sauren Seitenketten (z.B. Asparaginsaure, Glutamlnsaure), ungeladenen po- 
laren Seitenketten (z.B. Glycin, Asparagin, Glutamin, Serin, Threonin. Tyrosin, 

30 Cystein), unpolaren Seitenketten, (z.B. Alanln. Valin, Leucin, Isoleucin, Prolin, Phenyla- 
lanln, Methionin, Tryptophan), beta-verzweigten Seitenketten (z.B. Threonin, Valin, 
Isoleucin) und aromatischen Seitenketten (z.B. Tyrosin, Phenylalanin, Tryptophan, 
Histidin). Bn vorhergesagter nicht-essentieiler Aminosaurerest in einer Acyl- 
CoA:Lysophospholipid-Acyltransferase wird somit vor2ugsweise durch einen anderen 

35 Aminosaurerest aus der gleichen Seitenkettenfamilie ausgefeuscht Aftemativ konnen 
bei einer anderen Ausfuhnjngsform die Mutationen zufallsgemaB uber die gesamte 
Oder einen Teil der Acyl-CoA:Lysophospholipid-Acyitransferase-kodierenden Sequenz 
eingebracht werden, z.B. durch Sattigungsmutagenese, und die resultierenden Mutan- 
ten konnen nach der hier beschriebenen Acyl-CoA:Lysophospholipld-Acyltransferase- 

40" ■ Aktivitat durchmustert werden, um Mutanten zu identifizieren, die die Acyl-CoA:Lyso- 
phospholipid-Acyltransferase-Aktivitat beibehalten haben. Nach der Mutagenese einer 
der Sequenzen der SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5 Oder SEQ ID NO: 7 
kann das kodierte Protein rekombinant exprimlert werden, und die Aktivitat des Prote- 
ins kann z.B. unter Venwendung der hier beschriebenen Tests besHmmt wenJen. 
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tentanmeldung atierten Lfteraturstelten Pf^i^r^nJlf^ samtlicher in dieser Pa- 

5 Beispiele 
. Beisplel l: Allgemeine Verfahren 
a) Allgemeine Klonlerungsveilahren: 

Klonierungsverfahren. wle beisplelswelse Restrikfionsspaltungen Aaarosea«fP 

(Cold spring Harbor Laboratory Press: 18670 8796^309^^^^^^^ IfJ''^^^ 
und Mf^hell (1994) -Methods in Yeast Genetics" fS!^^^ "^'^^^^'^ 
15 Press: ISBN 0-87969^1^). ^©"©^cs (Cold Spnng Harbor l-aboratory 

b) C^emikaiien 

Die verwendetenChemilcalienwurden.wennIm Text nichtflnHaroo« u • 
Quaiitat von den Rimen Fluka (N^,, 1 1 ft?J. w^T angegeben, in p. A.- 

(Heldelberg) and SiTn^a (DeJeSofe^^^^^^ (Karlsruhe), Sen/a 

c) Klonierung und Expression von Desaturasen und Elongasen 

0 Der Escherichia coli-Stamm XL1 Blue mrp iron /a*^*^ 

der A-S-Desaturase aus Phvscomitrtl^^^^ (Stratagene) wurde zur Subklonierung 

1 1,5,% Agar(G8WjVol i wurtsfOrfaS^T^^T u ' "^'er) zugegeben, und 
(CMdum: slehe in: Aus^lTfTteTT^Jl^TfT^ "^"^ "'^ 
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Protocols in Molecular Biology, John Wiley & Sons, New York) mit entweder 2 % 
(Gew./Voi.) Raffinose Oder Glucose kultivlerl. Fur feste Medien wurden 2 % (GewTVol.) 
Bacto™-Agar (Difco) hinzugef Qgt Die zur Klonierung und Expression verwendeten 
, Plasmide sind pUCl8 (Pharmacia) und pYES2 (Invltrogen Co.). 

d) Klonierung und Expression PUFA-spezifischer Desaturasen und Etongaen 

Fur die Expression in RIanzen wurden cDNA Klone aus SEQ ID NO: 9, 11 oder 13 so 
modifiziert, dass ledigllch die Codierreglon mittels Polymerase Kettenreaktion unter 
Zuhilfenahme zweier Oligonukleotide amplifiziert werden. Dabei wurde darauf geach- 
tet, dass eine Konsensusequenz vor dem Startcodon zur effizienten Translation ein- 
gehalten wurde. Entweder wurde hierzu die Basenfolge ATA oder AAA gewahit und vor 
das ATG in die Sequenz eingefOgt (Kozak, M. (1986) Point mutations define a sequen- 
ce flanking the AUG initiator codon that modulates translation by eukaryotic ribosomes, 
Cell 44, 983-2929]. Vor diesem Konsensustriplett wurde zusatzlich eIne Restriktions- 
schnitt^elle eingefQhrt, die kompat'bel sein muss zur Schnittstelle des Zielvektors, 
in den flas Fragment kloniert werden soli und ml! dessen Hllfe die Genexpresslon in 
Mikroorganismen oder Pflanzen erfolgen soil. 

Die PCR-Reaktlon wurde mit Plasmld-DNA als Matrize in einem Thermocycler (Bio- 
metra) mit der Pfu-DNA-(Stratagene)Polymerase und dem folgenden Temperaturpro- 
gramm durchgefuhrt: 3 min bei 96°C, gefolgt von 30 Zyklen mit 30 s bei 96*C, 30 s bei 
55°C und 2 min bei 72°C, 1 Zyklus mit 10 rnin bei 72*C und Stop bei 4°C. Die 
Anlagerungslemperatur wurde je nach gewShlten Oligonukleotiden varliert. Pro Kiloba- 
senpaare DNA ist von einer Synthesezeit von etwa einer Minute auszugehen. Weitere 
Parameter, die Einfluss auf die PGR haben wie z.B. Mg-lonen, Salz, DNA Polymerase 
etc., sind dem Fachmann auf dem Gebiet geldufig und kdnnen nach Bedarf varliert 
werden. . 

Die korrekte GroBe des amplifizierten DNA-Fragments wurde mittels Agarose-TBE- 
Gelelektrophorese bestatigt Die amplifizierte DNA wurde aus dem Gel mit dem QIA- 
qutok-GelextrakHonskit (QIAGEN) extrahiert und in die Smal-RestrikUonsstelle des 
dephosphorylierten Vektors pUC18 unter Verwendung des Sure Clone Ugations Kit 
(Pharmacia) ligiert. wobei die pUC-Derivate erhalten wurden. Nach der Tiansformatton 
von E. coli XL1 Blue MRP kan wurde eine DNA-Minipraparation [Riggs, M.G., & 
McLachlan, A. (1986) A simplified screening procedure for large numbers of plasmid 
mini-preparation. BioTechnlques 4, 310-313].an ampicilllnresistenten Transformanden 
durchgefuhrt, und positive Klone mittels BamHI-Restriktionsanalyse identiflziert. 
Die Sequenz des klonierten PCR-Produktes wurde mittels Resequenzierung unter 
Venwendung des ABI PRISM Big Dye Terminator Cycle Sequencing Ready Reaction 
Kit (PerWn-Bmer, Weiterstadt) bestatigt. 
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e) Transformation von Agrobacterium 
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Die Agrobacterium-vermittelte Pflanzentransformation wurde, wenn nicht andere be- 
schrieben, wie von Deblaere et al. (1984, Nucl. Acids Res. 13, 4777-4788) mit Hilfe 
eines Agrobacterium tumefaciens-Stamms durchgefOhrt. 

f) Pflanzentransformation 

Die Agrobacterium-vemiittelte Pflanzentransformation wurde, wenn nicht anders be- 
schrieben. unter Venwendung von Standard-Transformations- und Regenerationstech- 
niken durchgefuhrt (GeMn, Stanton B., Schilperoort, Robert A., Plant Molecular Biology 
Manual, 2. Aufl., Dordrecfit: Kluwer Academic Publ., 1995, in Sect., Ringbuc Zentrale 
Signatur: BT11-P ISBN 0-7923-2731-4; Glick, Bernard R., Thompson, John E.. Me- 
thods in Plant Molecular Biology and Biotechnology, Boca Raton: ORG Press 1993 
360 S., ISBN 0-8493-51 64-2). 

Nach diesen kann beispielsweise Raps mittels Kotyledonen- Oder Hypokotyltransfor- 
mation iransfonniert werden (Moloney et al.. Plant Cell 8 (1989) 238-242; De Block et 
al.. Plant Physiol. 91 (1989) 694-701). Die Venwendung von Antiblotika fOr die Agro- 
bacterium- und Pflanzenselektion hangt von dem fflr die Transfonnation venwendeten 
binareh Vektor und Agrobacterium-Stamm ab. Die Rapsselektion wird dabei gewohn- 
lich unter Venwendung von Kanamycin als selektierbarem Pflanzenmarker durchge- 
fOhrt 

Die Transfomiation von Soja kann unter Venwendung von beispielsweise einer in 
EP-A-0 0424 047 (Pioneer Hi-Bred International) Oder in EP-A-0 0397 687, US 
5,376,543, US 5,169,770 (University Toledo) beschriebenen Technik durchgefOhrt 
werden. 

Die Pflanzentransformation unter Venwendung von Teilchenbeschuss, Polyethyien- 
glycol-vennittelter DIviA-Aufhahme oder uber die Silizlumcarbonatfaser-Technik ist bei- 
spielsweise beschrieben von Freeling und Walbot The maize handbook" (1993) 
ISBN 3-540-97826-7, Springer Verlag New York). 

Der Agrobacterium-vermittelte Gentransfer In Lein (Linum usitatissimum) wurde, wenn 
nicht anders beschrieben, wie bei Mlynarova et al. [(1994) Plant Cell Report 13:282- 
285] beschriebenen Technik durchfuhrt. 

g) PlasmidefQrdiePflanzentransfonnatlon 

Zur Pflanzentransfomiation wurden blnSre Vektoren auf Basis der Vektoren pBinAR 
(Hofgen und Willmilzer, Plant Science 66 (1990) 221-230) oder pGPTV (Becker et al 
1992, Plant Mol. Biol. 20:1 195-1 197) venwendet. Die Konstruktion der binSren Vekto- 
ren, die die zu exprimierenden NukieinsSuren enthalten, erfolgt durch Ligation der 
cDNA in Sense-Orientierung in die T-DNA erfolgen. 5' der cDNA aktiviert ein Pflanzen- 
promotor die Transkription der cDNA. Eine Polyadenyllerungssequenz befindet sich 3' 
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von der cDNA. Die binaren Vektoren konnen unterschiedfiche Markergene traqen wis 

n!«f M ^ ^ ® Resistenz gegen die Imidazolinone vermlttelt Oder das 

5 ■ ^nnhn ^'hT"',''^' "'"^ Kanamycln-Reslslenz vermfttelt dureh Neomy 
5,A cinphosphotransferase codiert. ■^wmy 

Die gewebespezifische Expression der Nukleinsauren lasst sich unter VenA^enduna 
• e.nes gewebespeziflschen Promotors eizielen. Wenn nicht anders b^Sen IrdP 
der LeB4- oder der USP-Promotor oder der Ptiaseolin-Promotor J 5^ cDNA ^^^^^^^^ 
ZnZtZ'^"^''7!T ^^'^ NOS-Terminator und der OCs'^^TZr- 

JiTprimt^ ^j;"®'® samenspezifische Promotorelement wie z.B. der Napin- oder Arce 

2000. 5.och,m.ca et B.ophys.ca Acta 1490(1.2):87.98) kann venvendet werden. 

2ur konsHftJtiven Expression in der ganzen Pflanzen lasst sich der CaMV-SSS- 
Promotor oder ein v-ATPase C1 Promotor verwenden. 

Die im Verfahren ven^vendeten Nukleinsauren. die fOr die Acvi-roA-i wc«r^h«o,,K .• 
i.) Promotor-Terminator-Kassetten 

Expressionskassetten bestehen aus wenigstens zwel funkUonellen EInhelten wie 

nZn nnr^ff H^"^"®^^^^ Targetting-Sequenzen, Codlerregfonen von Ge 
nen Oder Terien davon etc. eingefugt werden. 2um Aufbau der Expreionska^mfn 

35^^ ~"^5l^r ^^^^ — Baeum,^:™^^^^^ 

J' ^ <3)-'*59-67): OCS Terminator; Gielen et al. EMBO J 3 (1984) 835ff ) 

Wahi auf Basis von synthetischen Oligonukleotiden maSgeschneidert 
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Folgende Ollgonukleotide konnen beispieisweise verwendet werden: 
USP1 vorne: 

. CCGGAATTCGGCGCGCCGAGCTCCTCGAGCAAATTTACACATTGCX5A - 

if. ♦ 
USP2 vorne: 

- CCGGAATTCGGCGCGCCGAGCTCCTCGAGCAAATTTACACATTGCCA - 
USPS vorne: 

- CCGGAATTCGGCGCGCCGAGCTCCTCGAGCAAATTTACACATTGCCA - 
USP1 hinten: 

- AAAACTGCAGGCGGCCGCCCACCGCGGTGGGCTGGCTATGAAGAAATT - 
USP2 hinten: 

- CGCGGATCCGCTGGCTATGAAGAAATT - 
USP3 hinten: 

- TCCCCCGGGATCGATGCCGGCAGATCTGCTGGCTATGAAGAAATT - 
0CS1. vorne: 

- AAAACTGCAGTGTAGAAGGCCTCCTGCTTTAATGAGATAT - 
0CS2 vorne: 

- CGCGGATCCGATATCGGGCCCGCTAGCG1TAACCCTGCTTTAATGAGATAT - 
0CS3 vorne: 

- TCCCCCGGGCXJATGGCCTGCTTTAATGAGATAT - 
0CS1 hinten: 

-CCCAAGCTTGGCGCGCCGAGCTCGAATTGGTCGACGGACAATCAGTAAATTGA 

0CS2 hinten: 

-CCCAAGCTTGGGGCGCCGAGCTCGAATTCGTCGACGGAOAATCAGTAAATrGA 
0CS3 hinten: 

- CCCAAGCTTGGCGCGCCGAGCTCGTCGACGGAGAATGAGTAAATTGA - 
S*^^^?^" "'"^ "^"^ ^^'^'^ ^^"^ bekannt und sind allgemein litera- 

In einenfi ersten Schritt wurden ein Promotor und ein Terminator Qber PGR amplifiziert 
sZttTfp Empfangerplasmid kloniert und in einem ™ 

Schntt der Promotor vor den Terminator Inseriert. Dadurch wurde eine Expressions- 

ptr^erri'^^^^^^^^^^^^^ 
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Die entsprechenden Konstrukte bzw. Plasmide sind in SEQ ID NO- 1«; ift hfc iv ^ « 
niert. Sle enthalten den USP-Promotor und den oci rtZZ * 1 ^' ^® 
Plasmlde wurde das KonstruktZ^2 er^e,^^^^^^^^^ ^ 
. ten wurde und pUT2 mittels Xhol/Scal geschnltten wurde dt p^^ 
h. ten enthaltenden Fragmente wurden ligiert undTe S xS^^^^^ m^c fT*^"^^*- 
Es wurde nach Vereinzelung von ampLnrrsXerKo^ol^^^ 
per Restriktionsanalyse solche Klone identlfiziert prapariert und 

Diese^enthalten folgende Elemente: 
Tabelle 1 
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Weiterhin lassen sich wie beschrieben und wie in Tabelle 2 nSher spezifiziert weitere 
Multiexpressionskassetten mithilfe des 

. i) USP-Promotors oder-mlthilfe des 

li) 700 Basenpaare 3'-Fragmentes des LeB4-Promotors Oder mithilfe des 

III) DC3-Promotors erzeugen pnd fflr samenspezifische Gene}qpression einsetzen. 

Der DC3-Promotor ist beschrieben bei Thomas. Plant Cell 1996, 263:359-368 und be- 
steht ledlglich aus der Region -117 bis +26 weshalb er mithin einer der Welnsten be- 
kannten samenspezlfischen Promotoren darstelit. Die Expressionslcassetten konnen 
mehrfach den selben Promoter enthalten Oder aber Qber drel verschiedene Promotoren 
aufgebaut werden. 

Vorteilhaft venvendete Polyllnker- bzw. Polylinker-Termlnator-Polyllnker sind den Se- 
quenzeti SEQ ID NO: 23 bis 25 zu entnehmen. 



Tabelle 2: Multiple Expresslonskassetten 



Plasmidfiame des 
pUC19-DOTvates 


Schnittstellenvor dem 
jeweiligen Promotor 


Multiple 
Klonierungs-Schnittstellen 


Schnittstellen hinter 
dem OCS-Terminator 


pUTl 

(pUC19init 

usp-ocsn 


EcoRI/AscI/SacI/XhoI 


(1) BsiXJ/NoH/PsO/ Xbal/StuI 


Sall/EcoRI/SacI/AscF 
Hindm 


PDCT 

(pUC19mitDC3- 
OCS) 


EcoRI/AscI/SacI/XhoI 


(2) BamHI/EcoRV/ Apal/NbeV 
Hpal 


Sall/EcoRI/SacI/AscI/ 
Hindm 


PleBT 

(pUC19-mit 

LeB4(700)-OCS) 


EcoRI/AscI/SacI/XhoI 


(3) Bgin/Nael/ Oal/Smal/Nrcol 


Sall/Sacl/Ascl/Hindm 


PUD12 

(pUC 19 mit mit 
USP-OCSl und 
mitDC3-OCS) 


EcoRI/AscI/SacI/XboI 


(1) BsOLNoti/ Pstl/Xbal/Stal 
und 

(2) Bamm/EcoRV/ Apal/Nhel/ 
Hpal 


Sall/EcoRI/SacI/AscI/ 
Hindm 


PUDL123 
Triple expression 
cassette 
(pUC19 mit 
USP/DC3 und 
LeB4-700) 


EcoRI/AscI/SacI/XhoI 


(1) BstXI/NotI/ Pstl/Xbal/Stulund 

(2) BamHF (EcoRy*)/>^aI/NlieI/ 
Hpal und 

(3) Bgin/Nael/ Clal/Smal/Ncol 


Sall/Sacl/Ascl/Hindm 



EcoRV Schnlttstelle schneidet Im 700 Basenpaarf ragment des LeB4 Promoters 
, (LeB4-700) 
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Analog lassen sich weitere Promotoren fQr Multigenkonstaikte erzeugen msbesondere 
unter Verwendung des 

.a) 2,7 kB Fragmentes des LeB4-Promotors Oder mithilfe des 

b) Phaseolin-Promotors Oder mithllfe des 

c) konstitutlven v-ATPase c1-promotors. 

Es kann Insbesondere wOnschenswert sein, weitere besonders geeignete Promotoren 
zum Aufbau samenspezifischer IVIultiexpressionskassetten wie z.B. den Napin- 
Promotor Oder den Arcelin-5 Promotor zu verwenden. 

Weitere In Pflanzen nutzbare Vektoren mit einer bzw. zwel Oder drel Promotor- 
Terminator-Expressionkassetten sind den Sequenzen SEQ ID NO: 26 bis 
SEQ ID NO: 31 zu entnehmen. 

ii.) Erstellung von Expresstonskonstrukten, die Promotor, Tenninator und ge- 

wQnschte Gensequenz zur PUFA Genexpression fn pfianzlichen Expresslons- 
kassetten enthalten. 

In pUT123 wird zunachst Qber BstXI und Xbal die A-6-Elongase Pp_PSE1 In die erste 
Kassette Inseriert. Dann wfrd die A-6-Desaturase aus Moos (Pp_des6) Hb&x Bam- 
Hl/Nael In die zweite Kassette inseriert und schlieBlicli die A-5-Desaturase 
aus Phaeodactylum (Pt_des5) Qber Bglll/Ncol in die dritte Kassette inseriert (siehe 
SEQ ID NO: 19). Das Drelfachkonstrukt erhSIt den Namen pARA1. Unter Berflcksichti- 
gung sequenzspezifisclier Restriktionsscfinittstellen konnen weitere Expressionskas- 
setten gemaB Tabelle 3 mit der Bezelchnung pARA2, pARAS und pARA4 erstellt war- 
den. 
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Tabelle 3: Kombinationen von Desaturasen und Elongasen 



10 



Gen 
Plasmid 
oARAl 


A-6-Desatuiase 
Pp des6 


A-5-Desaturase 


A-6-£Iongase 


DARA2 


Pt des6 


Pt des5 
Pt des5 


Pp PSEl 
Pp PSEI 


t5ARA3 


Pt des6 


Ce dfisS 


Pp PSEl 


PARA4 


Ce_des6 | 


Ce des5 


CeJPSEl 



des5 = PUFA spezifische A-S-Desaturase 
des6 = PUFA spezifische A-6-Desaturase 
PSE = PUFA spezifische A-6-Elongase 
Pt_des5 « A-5-Desaturase aus Phaeodactylum tricornutum 

Pp-.des6 Oder PL.des6 = A-e-Desaturase aus Physcomitrella patens bzw. Phaeodacty- 

lum tncomutum ^ 
? = 1^^^'^^^^^^^ patens. Pt = Phaeodactylum tricornutum 
Pp_PSE1 = A-6-Elongase aus Physcomitrella patens 
Pt_PSEl =A-6-Elongaseaus Phaeodactylum tricornutum 

S~d2l : A n! CaenorhabdHis elegans (Genbank Acc. Nr. AF078796) 
t^n?f I'Sar' Caenorhabditis elegans (Genbank Acc. Nr. AF0314^; 

Ce^PSEI = ^^Bongase aus Caenorhabditis elegans (Genbank Acc. Nr. AF244356. 

Auch weitere Desaturasen oder Bongasegensequenzen kQnnen in Expressionskasset 
ten beschriebener Art inseriert werden wie 2.B. Genbank Acc Nr A^s?^ 
NM_013402. AF206662. AF268031. AF226273. AR 1^510 ^^^^^^^^ 

"'^ S^m tiX!!^®'^'^"''^^*''" Transformation von Agrobak- 
tenum tumefaaens und zur Transformation von Pflanzen 

ni! !^°"^^"'^® "litte's ASCI in den binSren Vektor pGPTV inseriert 

Die multiple Klonierungssequenz wurde zu diesem Zweck urn eine AscI SchnW^enp 

n.T «H ^" "'""""^ ^^"^ ^^^^ ^« dopp^te'i^ng^^^^^^^ 

nukleotde neu synthetisiert, wobei eine zusatzliche AscI DNA Sequenz efn^gt wird 
Das Oligonukleotld wurde mrtteis EcoRI und Hindlll in den Vektor pG^Tn^eriSt S 

Beispiel 1 beschneben nachgelesen werden. 

Ttef LSlSf^'^^"ic^^^^^^ '^""^^^ NukielnsSuresequenzen fOr 

tionqase (SEQ ID NO. 11), die Sequenzen aus Physcomitrella patens und Phaedactv- 
lum tncorn^um venvendet. Die entsprechenden ArnlnosSuresequeSn ^n^de^^^ 
quenzen SEQ ID NO: 10. SEQ ID NO: 12 und SEQ ID NO: 14. Bn V^^^VZ^r 
genannten Gene enthait ist in SEQ ,D NO: 1 9 wiedergegeben. Die koXondteren^en 
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SSr^lu el^^^^^^ ""^ ^^"^ '° ^' NO: 21 und SEQ ,D 

Beispiel 2: Klonierung und Charakterlslerung der ceLPLATs 
»n - 

a) Datenbanken-Suche 

" rill? f Sr"? "^^^ '=eLPLATs,(= Acyl-CoArLysophosphohpid-Acyltransferase aus 
Caenorhabdrt.s elegans) erfolgte durch Sequenzvergleiche mtt bekannten 

1^90 215- ™f ^-''-A'Sorrthmus (Altschu. et a... J. Mol bS[ 

1990, 215^403-410) auf das Nematodengenom (CaenorhabdiUs elegans) beschrankt 
da dieser Organismus LCPUFAs synthetisiert. FQr den Sequenz^^Sh diente 

MP 061350). LPUT katalysiert durch eine reversible Transferasereaktion die ATP- 

faZuy!ZlTJ^ T^T;^ Phospholipiden mit Hilfe von S^^^L 
factor (Yamashita et al.. J. B.of. Chem. 2001 . 20: 26745-26752). Durch Sequenzver- 

T06E8. 1 bzw. F59F4.4). Die Identifizierten Sequenzen welsen die grdBte Ahnllchkeft 
b) Klonierung der CeLPLATs 

Auf der Basis der ceLPLAT-NuklelnsSuresequenzen wurden Primeipaare synthetisiert 
Crab^l) und mittels PCR-Verfahren die zugehorigen cDNAs aus efner C. ^^nl 
cDNA-Sank .soliert. Die entsprechenden Pnmerpaare wurden so ausgewat^ats s.e 
d^Hefe-Konsensus-Sequenz fOr hocheffiziente Translation (Kozak Cengss^ 2^ 
292) neben dem Startcodon trugen. Die Ampllflzlening der LP^^^^Trdtlf 
weils mit 2 pi cDNA-Bank-Losung als Template. 200 pmTntPs IlT"^^^^^ 

95 In^ Bedingungen fur die PCR waren wie folgt Erste Denaturlerung bel 

95 C fur 5 Minuten. gefolgt von 30 ZyWen bel 94°C fur 30 Sekunden. 58»C fur eIne 
M,nu^e und 72-C fur 2 l^nuten sow,e ein letzter Verl&^^^^ 

M.nuten. D.e Sequenz der LPLAT-cDNAs mi.rde durch DNA-lequenJ^Lng be^«^ 
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Tabelle 4: Nukleotldsequenzen der PCR-Primer zur Klonierung von CeLPLATs 



Primer 


Nukleotidsequenz 


5' TOSES-lf* 


5' ACATAATGGAGAACTTCTGGTCGATCGTC 3' 


3'T06E8.1r* 


5' TTACTCAGATTTCTTCCCGTCTTT 3' 


5' F59F4.4f* 


5' ACATAATGACCTTCCTAGCCATATTA 3* 


3' F59F4.4r* " 


5' TCAGATATTCAAATTGGCGGCTTC 3' 



Belspiel 3: Anaiyse der Auswirkung der rekonibinanten Proteine auf die ProdukUon 
des gewQnsciiten Produktes 

a) Aufarbeitungsmoglichkeiten 

Die Auswirkung der genetischen IVIodifikatlon in Pllzen, Algen, Ciliaten oder wie in den 
Beispielen weiter oben beschrieben in Hefen auf die Produktion der mehrfaoh ungesSt- 
tigten Fettsauren oder Pflanzen kann bestimmt warden, indem die modifizierten Mikro- 
organismen oder die modlfizierte Pflanze unter geeigneten Bedingungen (wie den vor- 
stehend beschriebenen) gezOchtet werden und das Medium und/bder die zellularen 
Komponenten auf die erholite Produktion der Liplde oder Fettsauren untereucht wird 
Diese Analysetechniken sind dem Fachmann bekannt und umfassen Spektroskopie 
DQnnschichtchromatographie, Farbeverfahren verschiedener Art. enzymatische und 
mikroblologlsche Verfahren sowie analytische Chromatographie, wie Hochleistungs- 
FIQssigkeitschromatographie (siehe beispielsweise Ullman, Encyclopedia of Industrial 
Chemistry. Bd. A2. S. 89-90 undS. 443-613. VCH: Weinheim (1985); Fallon, A , et al 

(1987) -Applications of HPLC in Biochemistry" in: Laboratory Techniques in Biochemis- 
try and Molecular Biology, Bd. 17; Rehm et al. (1993) Biotechnology, Bd. 3. Kapltel III- 
"Product recovery and purification", S. 469-714, VCH: Weinheim; Belter. P.A., et al. 

(1988) Bioseparations: downstream processing for Biotechnptogy, John Wiley and 
Sons; Kennedy, J.F., und Cabral, J.M.S. (1992) Recovery processes for biological Ma- 
tenals, John Wiley and Sons; Shaeiwitz, J.A., und Henry. J.D. (1988) Biochemical 
Separations, In: Ullmann's Encyclopedia of Industrial Chemistry, Bd. B3; Kapltel 1 1 S 
1-27, VCH: Weinheim; und Dechow, F.J. (1989) Separation and purification techniques 
in biotechnology. Noyes Publications). 

Neben den oben enwShnten Verfahren zum Nacliweis von Fettsauren in Hefen werden 
Pflanzeniipide aus Pflanzenmaterial wie von Cahoon etal. (1999) Proc. Natl. Acad Sci 
USA 96 (22):12935-12940, und Browse et al. (1 986) Analytic Biochemistiy 152-141*- 
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145, beschrieben extrahiert. Die qualitative und quantitative Lipid- oder FettsSure- 
analyse ist beschrieben bei Christie. William W., Advances in Upid Methodology 
Ayr/Scotland: Oily Press (Oily Press Upid Ubrary; 2); Christie, William W., Gas Chro- 
' matography and Lipids. A Practical Guide - Ayr, Scotland: Oily Press. 1989, Repr 
1992,1X. 307 S. (Oily Press Upid Ubrary; 1); "Progress in Lipid Research, Oxford- Per- 
gamon Press. 1 (1952) - 16 (1977) u.d.T.: Progress in the Chemistry of Fats and Other 
Lipids CODEN. 

So kann die Analyse von Fettsauren oder Triacylglycerin (= TAG. AbkOrzungen in 
Klammern angegeben) 2.B. mittels Fettsauremethylester (= FAME), Gas-Flussigkeits- 
aLcTerfol^e?'^^^^ ^^^^^ DOnnschlchtchromatographie 

Der unzweideutige Nachweis fur das Vorliegen von Fettsaureprodukten kann mittels 
Analj^ rekomblnanter Organismen nach Standard-Analyseverfahren erhalten werden- 
GC, GO-MS Oder TLC, wie verschiedentllch beschrieben von Christie und den Litera- ' 
ttjrstelten darin (1997. in: Advances on Upid Methodology, VIerte Aufl.: Christie. Oily 

. ®f 'il^o'*^®' ^^schromatographie-Massenspektromelrie-Verfahren, 
LipiGl6 33^343-353). ' 

Das zu analysierende Pflanzenmaterial kann dazu entweder durch Ultraschallbehand- 
lung, Mahlen in der Glasmuhle. flQssigen Stickstoff und Mahlen oder Qber andere an- 
20 wendbare Verfahren aufgebrochen werden. Das Material wird dann anschlieSend nach 
dem Aufbrechen zentrifugiert. Das Sediment wird danach In Aqua dest. resuspendiert 
10 mm bei 100»C erhitzt, auf Bs abgekOhlt und emeut zentrifugiert. gefolgt 
von Extraktion in 0.5 M Schwefelsaure in Methanol mit 2 % Dimethoxypropan fOr 1 Std 
bei 90»C. v^s zu hydrolysierten Ol- und Upidverbindungen fuhrt. die transmethylierte ' 
25 Upide ergeben. Diese Fettsauremethylester kfinnen anschlieBend in Petrolether extra- 
? ®C-Analyse unter Verwendung einer KapillarsSule (Chrom- 

pack. WCOT Fused Silica. CP-Wax-52 CB. 25 mikrom. 0,32 mm) bei einem Tempera- 
turgradienten zwischen 170»C und 240oc fCir 20 min und 5 min bei 240»C untenworfen 
werden. Die Identitat der erhaltenen Fettsauremethylester lassen sich unter Verwen- 
30 dung von Standards, die aus kommerziellen Quellen erhaltlich sind (d.h. Sigma) def i- 
nieren. " 
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Bei Fettsauren. fOr die keine Standards verfiigbar sind, kann die Identitat Qber Derivati- 
sierung und anschlieBendd GC-MS-Analyse gezeigt werden. Beispielsweise wird die 
Lokalisierung von Fettsauren mit Dreifachbindung Qber GO-MS nach Derivatisieruna 
mit 4.4-Dimethoxyoxa?olin-Derivaten (ChrisBe. 1998. slehe oben) gezeigt 

b) Fettsaureanalyse In Pflanzen 

Die Gesamt-Fettsauren wurden aus Pflanzensamen extrahiert und mittels Gaschroma- 
tographle analysiert. 
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nirt e,ner Rate von s-C/min und sohlieBllch auf iB^m^^ ^ 
iderrtifizlerl. ^ ^ Retenbonszerten von FAME-Standartis (SIGMA) 

Beispfel 4: FunktfoneHe Charakterierung der CeLPUTs in Hefe 
®^ Heterotoqe Fxnression in ■Q«^o», mvnA« ^oro.«v.-^^ 

20 das die olfenen Leserahmen efner/SSS^f^^S^^'^' ''^'S^'"' 

Vektoren pYes2-T06E8 1 md^scS^^S^f^t'^'^ Blelchzeitig mit den 

funkUonenen e<pressibn ausaeodhit nta h^„K^ ^ 5 "^^^^ weiteren 
35^ Hefastamm ll^ei JS^SlT^ "^"nebenan B<partn»nte wu«aan auch im 

OMdu..™s.g.ediu. (oHna ul^r Sr^S^T^ir^CL" 
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NP-40 und 250 pM UnolsSure {18:^' ''^ Oder Unolensiure (18:3*8-^2.i5) ^^^^ 
mit den Vorkulturen auf eine ODeooVon 0,08 angeimpft. Die Expression wurde bel eIner 
ODeoo von 0.2-0,4 durch die Zugabe von 2% (w/v) Galactose induziert. Die Kulturen 
• wurden fOr weftere 48 h bei^O'C inkubiert. 

5 Fettsaureanalvse 

. Die Hefezellen aus den Hauptkulturen wurden durch Zentrif ugation (1 GO x g 1 0 min 
20''Cj geerntet und mit 100 mM NaHCOg, pH 8,0 gewaschen, urn restliches Medium' 
und Fettsauren zu entfemen. Aus den Hefe-Zellsedimenten wurden Fettsauremethyl- 
ester (FAMEs) durch saure IViethanolyse hergestellt. Hierzu wurden die Zellsedimente 
0 mit2 ml 1 N methanpllscher Schwefefsaure und 2% (v/v) DImethoxypropan fur 1 h bei 
SO'C inl<ubiert. Die Extraktlon der FAMES erfolgte durch zweimalige Extraktlon mit 
Petrolether (PE). Zur Entfernung nlcht derivatisierter Fettsauren wurden die organl- 
schen Phasen je einmal mit 2 mIlOO mM NaHCOg, pH 8,0 und 2 ml Aqua dest. gewa- 
schen. AnschlleBend wurden die PE-Phasen mit NaaSO* getrocknet. unter Argon eln- 
5 gedampft und in 100 \i\ PE aufgenommen. Die Proben wurden auf einer DB-23- 
Kapillarsaule (30 m, 0,25 mm, 0.25 |jm, Agilent) In einem Hewlett-Packard 6850- 
Gaschromatographen mit Flammenlonlsationsdetektor getrennt Die Bedlngungen fOr 
die GLOAnalyse waren wie folgt: Die Ofentemperatur wurde von 50°C bis 250''C mit 
eIner Rate S^C/mln und schlleBlich 10 mIn bel 250»C (halten) programmlert. 

0 Die Identifikation der Signale erfolgte durch Verglelche der Retentlonszelten mit ent- 
sprechenden FetteSurestandards (Sigma). 

Acvl-CoA Analyse 

Die Acyl-CoA-Analyse erfolgte wIe bei Larson and Graham (2001 ; Plant Journal 25- 
115-125) beschrieben. 

Expressionsanalvse 

Figuren 2 A und B sowie 3 A und B zeigen die Fetts§ureprofile von transgenen 
C13ABYS86 Hefen. die mit 18:2^'-^2 bzw. l8:3^«-^2-^^ gefuttert wurden. Die gefQtterten 
Substrate sind in groBen Mengen in alien trahsgenen Hefen nachzuwelsen. Alle vier 
transgenen Hefen zeigen eine Synthese von 18:3"*^* und 20-3**'^^*^'* bzw 
I8:4^«.s.i2.i5 und 20:4^« "-^^-". den Produkten der A-6- Desaturase und A-6-Elongase 
Reaktionen. Dies bedeutet, dass die Gene Pp.D6 und Psel funktional exprimlert wer- 
den konnten. 

Rgur 2 gibt wie oben beschrieben die Fettsaureprofile von transgenen C13ABYS86 S 
cereu/s/ae-Zellen. Die Synthese der Fettsauremethylester erfolgte durch saure Metha- 
nolyg^ Intakter Zellen, die entweder mit den Vektoren pESCLeu-PpD6-Pse1/pYes2 (A) 
oderpYes2-T06E8.1/pESCI_eu-PpD6.Pse1 (B) transformlert worden waren. Die Hefen 
wurden in Minlmalmedium In Gegenwart von 18;2^'« kultlviert AnschlleBend wurden 
die Fettsauremethylester Ober GLC analysiert 
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In den Kontroll-Hefen, die mit den Vektoren pESCLeu-PpD6-Pse1/pYes2 transformlert 
wurden. ist der Anteil von 20:3^«•^^•^^ zu dem l&S^^-^-^^ durch Pse1 elongiert wird we- 
sentlich niednger als In den Hefen, die zusStzlich die LPLAT T06E8 1 exprimleren Tat- 
sachiioh konnte die Bongatlon von 18:3^»'^2 ^8:4^.9.12.15 ^^^^^ ^.^ zusatzliche 

».>• Expression von CeLPLAT(T06E8.1) urn 100-150% verbessertwerden(Rgur 4) Diese 
signifikante Erhdhung des LCPUFA-Gehalts ist nur wie folgt zu erklaren: die exoqen 
gefOtterten FettsSuren (18:2^^-^^ bzw. 18:3^«-^2.^«) werden zunachst In Phosphollpide 
eingebaut und dort von der A-6-Desaturase zu 18:3^'^'^2 ^3.4^6,9.12.15 desaturierl 
Erst nach Re§qullibrierung mit dem Acsyl-CoA-PooI k6nnen 18:3^a« und i8-4'^ »'^2.is 
durch die Elongase zu 20:3-« ".-. bzw. 20:4-«.^^.'^-^^-CoA elongiert und dann wieder In 
die Lipide eingebaut werden. Die LPLAT T06E8. 1 ist in der Lage. die A6-desaturlerten 
Acylgruppen sehr efflzlent In CoA-Thloester zuruckzuvenwandeln. Interessantenweise 
konnte auch die Bongatlon der gefOtterten FettsSuren ISJ^ '^ und 18:3^'-'2.16 ygrbes- 
sert werden. (Rgur 2 A und B bzw. 3 A und B). 

Rgur 3 gibtdle Fettsaureproflle von transgenen C13ABYS86 S. cereu/s/ae-Zellen Die 
^the^e der FettsSuremethylester erfbigte durch saure Methanolyse Intakter Zellen 
die entweder mit den Vektoren pESCLeu-PpD6-Pse1/pYes2 (A) oder pYes2- 
T06E8.1/pESCLeu-PpD6-Pse1 (B) transformiert worden waren. Die Hefen wurden in 
Minimfilmedlum In Gegenwart von ^8:3f''''^^'^kumen. AnschlleBend wurden die Fett- 
sauremethylester Qber GLC analysierL 

Die B^pression einer anderen CeLPLAT (F59F4.4) hat dagegen kelnen EInfluss auf die 
Bongatlon (Rgur 4). Offenbar kodlert F59F4.4 nicht fur eine LPLAT. NIcht jede der 
putabven LPLAT NuklelnsSuresequenzen ist also enzymatisch aktiv in der erfindungs- 
gemaB gefundenen Reaktlon. 

Rgur 4 gibtdle Elongation exogen applizierter 18:2^^« bzw. I8:3^««i5 im Anschluss 
an ihre end^ene A-e-Desaturlerung (Daten aus Rg. 2 und 3) wieder. Die exogen ge- 
futtertenFettsauren werden zunschst in PhosphollpkJe eingebaut und dort zu l8:3^«'«-« 
iS Ja^i ;.„h' J^S'its'!; "^^"^ Re^qulllbrierung mit dem Acyl-CoA-Pool kSnnen 
18.3 • • 2 und i8:4^^-« «'is durch die Elongase zu 20:3*° "-'''- bzw 20-4^« "'^'»-'^-CoA 
elongiert und dann wieder in die UpWe eingebaut werden. Die LPLAT T06E8 1 ist in 
der Lage. die A-6-desaturierten Acylgmppen effizient In CoA-Thloester zuruckzuver- 
wandeln. 

DIese Ergebnisse zelgen. dass die CeLPLAT (T08E8.1) nach Co-expression mit der 
A-e-Desaturase und A-6-Elongase zu eIner effizlenten ProdukBon von C20-PUFAs 
fuhrt. Diese Ergebnisse sind dadurch zu erklSren. dass die CeLPLAT (T06E8 1) einen 
effizlenten Austausch der neusynthetisierten Fettsauren zwischen Lipiden und dem 
Acyl-CoA-Pool ermdgllcht (siehe Rgur 7). 

1 * 

Rgur Y gibt die Acyl-CoA-Zusammensetzung transgener INVScI Hefen. die mit den 
Vektoren pESCLeu PpD6Rse1/pYes2 (A) oderpESCLeu-PpD6-Pse1/pYes2-T06E8 1 
(B) transfomiiert worden waren, wieder. Die Hefezellen wurden in MInimalmedium oh- 
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ne Uracil und Leucin In Gegenwart von 250 pM 18:2«'2 kultrviert. Die Acyl^oA- 
Denvate wunden Qber HPLC analyslert. 

• r^n^^c.T!!"''""^ "^^^ Hefe-Stammes INVScI zur Co-Expression von CeLPLAT 
r PDOe^nri ^/«iT®" u"^ ^'"^^ B"^- Kontrollhefen. die 

013ABYS86 gezergt nur gennge Mengen des Hongationsprodukts (20-3*« "'^'' hei FOt 
■ ' ^ bel FQtterung von 18:3; slehe RgS s A und 6 A) Bei 

^satel^cher Expression von CeLPLAT (T06E8.1) erfolgt ein deutlfcher Anreg dieser 

Elongationsprodukte (siehe Figur 6 B und 6 B). Tabelle 6 zeigt, dass die ^m^e 

an 20.3 (ber Fytterung von 18:2) bzw. 20:4^-^ ^-^^-^^ (bel FOtteruna von 18-3^ hp 
WTkt. Daneben zelgt sich. dass auch CI 6:2-- zu C18:2^.« efff^nte?^el^Urt id" 



I 
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Feteaure-Zu|arnmenset2ung (in mol o/o) transgener Hefen. die mft den 
Vektoren pESCLeu PpD6Pse1/pYes2 (PpD6 Psel) Oder dESClT, 

waren. D.e HefezeHen wu«len in IWIinlmalmedium ohne Uracil und Leucin 
m Gegenwart von 250 pM 18:2 ^-^^ oder I8:3^.i^i« kultiviert Die iSt 
^nZ'T-f ' r^'" ^"^^ Methanolyse ganzer ZeHen gj^ 
± Standardabweichung wieder. "M" 




Figur 5 ist das Fettsaure-Profile.von transgenen INVScI S cerevi^jia*. , * 
inarasr Z9Uen, die snttveder mif den Vektoren pESCLeu-PnDe-Psel/bYBO /4\ 
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den in Minimalmedium in Gegenwart von 18:2^-^? kultlvlert AnschlleSend wurden die 
Fettsauremetliylester iiber GLC analysiert. 

. Figur 6 gibt die Fettsaure-Profile von transgenen INVSd S. cerewsiae-Zetten wieder 
Siflithese der FettsSuremethylester erfolgte durch saure Methanolyse intakter Zei- 
5 len. die entweder mit den Vektoren pESCLeu-PpD6-Pse1/pYes2 (A) Oder pYes2- 
T06E8.1 A)ESCLeu-PpD6-Pse1 (B) transformiert worden waren. Die Hefen wurden in 
. Minimalmedium In Gegenwart von l8:3^«-'« kultiviert. AnschlieBend wurden die Fett- 
sSuremethylester Qber GLC analysiert. 

EIn MaB fQr die Effizlenz der LCPUFA-Biosynthese in transgener Hef e stellt der Quo- 
^!o^^^Mt^ Z!^'!!?^'^'' A-e-Elongationsprodukt nach A-S-Desaturiemng 
^91215 20:4^«"-^'»-i') zu Gehalt an zugefutterter FettsSure (18:2^-^2 bzw 
18:3^ • • ) dar. Dieser Quotient betragt 0.04 in INVScI Kontrollhefen. die PpD6 und 
Psel exprimieren, und 0.60 in Hefen die zusatzlioh zu PpD6 und Pse1 CeLPLAT 
exprimi^ren. In anderen Worten: der Gehalt an enwunschtem A-6-Elongationsprodulcl 
15 nach A-6-Desaturierung bei Co-Expression von CeLPUVT betragt 60% des Gehalts der 
jeweilszugefQttertenFettsaure. In Kontrollhefen betrSgt dieser Gehalt nur ca 4% Dies 
bedeutet eine 15-fache Erh6hung der Effizienz der LCPUFA-Blosynthese in transgener 
Hefe durch Co-Expression von LPU^T. 

Interessantenveise bewirkt die Co-Expression von CeLPLAT nicht nur eine ErhShung 
0 der genannten Bongatlonsprodukte 20:3^« " ''' bzw. 20:4^-^^ "-i^ sondern auch eine 
Eriiohung des VerhSltnisses 20:3^"'^'* : 20:2'^"'^^ bzw. 20*4^®*'*'**'*^*^^ " 20*3^'' ^•'^^''''^ Dies 

If? ~" '^^Usf li*^'' ^^'^ A-6-Elongase bevorzugt mehrfach un- 
gesattigte Fetlsauren (18:3^«.«« und i8:4-«.««.«) ais Substrat ven«.endet. wahrend bei 
Ab>^senhert der LPLAT keine ausgeprSgte Substratspezifitat zu erkennen ist (auch 
18:2- • und 18:3^ • werden elongiert). Grund hierfOr k6nnen Protein-Protein- 
Wechselvw-rtcungen zwischen A-6-Elongase. A-6-Desturase und LPLAT Oder posttrans- 
lationale Modifikationen (z.B. partielle Proleolyse) seln. Dies wQrde auch erklSren wa- 
rum der oben beschriebene Anstieg von A-6-Elongationsprodukten bei Co-Expression 
von A-6-Desaturase. A-6-Elongase und LPLAT bei Venwendung eines protease- 
def izienten Hefestamms geringer ausfallt. 

Acyl-CoA Analysen von transgenen INVScI Hefen. die mit 18:2^« « gefOttert wurden 
!?!^"i2'i^T'^®! ^'^Ifll'' Kontrollhefen. die PpD6 und Psel exprimieren. ist kein 

p'SvfS^C'T"^'' nachwelsbar. Dies weist darauf hin. dass w;der 
das Substrat (18:3*«-^«.CoA) noch das Produkt (20:3^«'"'"-CoA) der A-6-Elongase in 
Kontrollhefen in nachweisbaren Mengen vorhanden ist. Dies ISsst darauf schlleSen 
das der Transfer von 1 8:3^-« « aus Membranlipiden in den Acyl-CoA Pool nicht ode^ 
nicht nchtig slatlflndet. Das bedeutet, dass kaum Substrat fiir die vorhandene A-6- 
Elo/igase zur VerfOgung steht. was wiedeaim den geringen Gehalt an Elongatlonspro- 
dukt in Kontrollhefen erklSrt. INVSd Hefen, die zusatzlioh zur PpD6 und Psel die 
CeLPLAT exprimieren und mit 18:2^«-^2 gefiittert worden waren, weisen kelne signifi- 
kanten Mengen an 18:3^«-«'2.coA auf. wohl aber 20:3*« "-i'».CoA. Dies deutet darauf 
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hin. dass LPLAT sehr effizient 18:3^'''^2 aus den Membranliplden in den Acyl-CoA- 
ro^Jf/!!:^'!- ■'«'3"''''-CoA wird dann von der A-G-Elongase elonglert, so dass kein 
l8:3^««-Ck>A, wohl aber aOiS^^-^'^-CoA nachwelsbar ist. 

b) Funktionelle Charakterierung der CeLPLATs in transgenen Pflanzen 
^. Exoresslon funkHonater n eLPLAT in transaenen Pflff nyon 

In DE 102 19 203 wurden transgene Pflanzen beschrieben. deren SamenSI durch sa- 
menspezifische Expression funktioneller Gene kodierend f Qr A-6-Desaturase A-6- 
Elongase und A-5-Desaturase gerlnge Mengen an ARA und EPA enthSIt Der zur 
Transformation dieser Pflanzen benutzte Vektor ist SEQ ID NO: 19 zu entnehmen Urn 
0 den Gehalt an diesen LCPUFAs zu erhdhen, wurde in den genannten transgenen * 
Pflanzen zusatzllch das Gen CeLPLAT (T06E8.1) in Samen exprlmiert 

Zu dies6m Zweck wurde der kodierende Bereich von CeLPLAT Qber PGR amplifiziert. 

In Tabelle 6 sind die Primer wiedergegeben. die zur Klonierung eines weiteren Qones 
der ceLPLAT in binSre Vekloren venwendet wurden. 

5 Tabelle 6: Nukleotidsequenzen der PCR-Primer zur Klonierung von CeLPLAT 
(T06E8.1) in den blnaren Vektor pSUN3 



Primer 


Nukleotidsequenz 


AReSOSr 


5' TTAAGCGCGGCCGCATGGAGAACTTCTGGTCG 3* 


AReSOiF" 

* f* fnnuarri r* rmt#AmA 


5'ACCTCGGCGGCCGCCCI 1 1 1 ACTCAGATTTC 3' 



Das PCR-Produkt wurde In einen pENTRY Vektor zwischen USP Promoter und OCS- 
Temiinator kloniert. AnschlieBend wurde die Expressionskassette in die binaren Vekto- 
ren pSUNSOO kloniert. Der entstandene Vektor wurde mit pSUrsl3CeLPLAT (Rgur 8) 
bezeichnet. DarOber hinaus wurde der kodierende Bereiche von CeLPLAT amplifiziert 
und zwischen LegB4 Promdtor und OCS-Tenninator kloniert Dieser Vektor wurde mit 
pGPTVCeLPLAT bezeichnet (Rgur 9A). 

Daruberhinaus wurde der kodierende Bereich von CeLPLAT uber PCR amplifiziert und 
^ zwischen LegB4 Promotor und OCS-Temiinator kloniert. Die hierfur venvendeten PCR 
Pnmer wurden so ausgewdhlt, dass in das PCR-Produkt eine efflziente Kosaksequenz 
eingefuhrt wurde. AuSerdem wurde die DNA-Sequenz von CeLPLAT so verSndert 
dass sie der codon usage von hoheren RIanzen angepasst war. 
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Folgende Primer wurden f Qr die PCR verwendet 

Forvvard prirner: 5'.ACATAATGGAGAACTTCTGGTCTATTGTTGTGTTrr^ 
Rever^p primer: 5'- CTAGCTAGCTOCTCAGATTTCTTCCCGTCTTTTGTTTCTC-3' 
Das PCR Produkt wurde In den Klonierungsvektor dCR Scriot Wontert ..nw .-.k^, ^- 

LJPLAT aus Caenortiabdrts ategans reloht NuWeotld 2805 bis 3653 in der SEQ iD 

Itl^^ rd"^m^^!f " PSUN3CeL<»LAT und dam in 

Pfl^nS^^^^a^oi^ •^'*°'«*»^ wobei die Seteldion *anagenar 
r,™""^ auBerdem tiansformiert mil dem Vektor pGI^ USPXVx 

Lein wurde mit dem Velctor pSUNSCeLPLAT trfln<rfr.rr«!«r* rx-^ ^ 
uesaturase, A-6-Elongase und A-5-Desaturase enthielten 

Shn^!"; ""^ "-einpflanzen wurden wie weiter vorne be- 
scJjneben [Be.sp,el 3 b)] auf emeWe Gehalte an LCPUFAs in untersucM 

Aus den hier vorliegenden.Arbelten ISsst sich die Funktion der AcvI-CoA-i v«o 
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Desaturasen katalysieren die Einfuhrung von Doppelbindungen in lipidgelcoppelte Fett- 
sauren (sn2-Acyl-Phosphatidylcholin), waiirend die Elongasen exklusiv die Elongation 
Coenzym A-veresterter FettsSuren (Acyl-CoAs) katalysieren. Nach diesem Mechanis- 
mus erfordert die altemlerende WIrkung von Desaturasen und Elongasen einen standi- 
gen AUfetausch von Acyl-Substraten zwischen Phosphollplden und Acyl-CoA-Pool und 
somit die Existenz einer zusStzlichen Aktivitat. die die Acyl-Substrate in die jeweils 
notwendige Substratform, d.h. Upide (fOr Desaturasen) oder CoA-Thioester (fur Elon- 
gasen). Qberfuhrt. Dieser Austausch zwischen Acyl-CoA Pool und Phospholipiden wird 
durch LCPUFA-spezifische LPLAT ermogllcht. Die Biosynthese von ARA (A) erfolgt 
analog zu EPA (B). mit dem Unterschled, dass bei EPA der A-6-Desaturiemng eine A- 
15-Desaturierung vorgeschaltet ist, so dass a18:3-PC als Substrat fur die A-6- 
Desaturase fungiert. Die Biosynthese von DHA macht einen weiteren Austausch zwi- 
schen Phosphollplden und Acyl-CoA-Pool Qber LPLAT notwendig: 20:5^®*^^'^'*'<'' wird 
^*^'"o7'i'o°?i6?9'''^'^" ^""^ CoA-Pool transfsriert und nach erfblgter A-5-Elongatlon wird 
22:5 • ■ • • vom CoA- zum Phospholipld-Pool transferiert und schlieBlich durch A-4- 
Desaturase zu DHA umgesetzt. Gleiches gilt fur den Austausch im Biosyntheseweg 
unterVenwendung der A-8-Desaturase. der A-9-Elongase und der A-5-Desaturase. 

Aquivalente 

Der Fachmann erkennt Oder kann viele Aquivalente der hier beschriebenen erfin- 
dungsgemaBen spezlfischen Ausfuhrungsfonnen feststellen. Indem er ledlglich Routl- 
neexperimente verwendet. Diese Aquivalente sollen von den PatentansprOchen um- 
fasst sein. 
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Patentanspriiche 



6. 



Isolierte Nuklelnsauresequenzen. die fOr Polypeptide mit Acyl-CoA:Lyso- 
phospholipid-Acyltransferaseaktivitat codieren. wobel die durch die Nukleln- 
sauresequenzencodlertenAc^^^^^^^ 

. l^^^l^r^Zt '"''^''' Doppelt^ndung Im 

Isollerte Nuklelnsauresequenzen gemas Anspruch 1 ausgewShlt aus der Grup- 

fj"®'' Nuklelnsauresequenz mit der In SEQ ID NO: 1. SEQ ID NO- 3 SEQ 
ID NO: 5 Oder SEQ ID NO: 7 dargestellten Sequenz, 

^^''XZ^^^'^T^^V'^ "■^'^ ^'^ ^-^S^^"'^ degenenerten geneti- 
' ^^^^K.l®^ '° 1' SEQ ID NO: 3, SEQ ID NO- 5 oder 
SEQ ID NO: 7 enthaltenden codlerenden Sequenz ablUen laien 

c) Derlvate der In SEQ ID NO: 1. SEQ ID NO: 3. SEQ ID NO: 5 Oder SEQ lb 
c=A^n M?f Nukleinsauresequenz. die fur Polypeptide mit der 7n 

Am^locf^ k'*"'^^^o ""^ mindestens 40 % Homologle auf 

sS??nlT^"* '° 2' '° "^O^ 4- 'D NO: 6 Oder 

SEQ ID NO: 8 aufweisen und eine Acyl-CoA:Lysophosphollpid. 
Acyltransferaseaktlvitataufwelsen. 

Genkonsfrukt nach Anspruch 5. dadurch gekennzelchnet. dass das Nukleinsau- 
rekonstrukt zusatellche Biosynthesegerie des Fettsture- oder Lif^dstotve^^^^^^ 
enthalt ausgewahit aus der Gruppe Acyl-CoA-Dehydrogenase(n) SS^^^^^^ 
acyl earner protein]-Desaturase(n). Acyl-ACP-ThfoestlaseTn) f^^^ 
Werase(n). Fettsaure-Synthase(n), Fettsaure-Hydroxylase n "^^^^ 
, ..Coenzym A-Oart)oxylase(n). AcyKJoenzym AK)xldase(n). Fet^siu/^ 
CoSrit':!' '=f f --A<^-^-nasen. Upoxygenasen ta^^^^^^:^^ 
Ly^asen. Al lenoxid-Synthasen, Hydroperoxid-Lyasen Oder Fettelure- 
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leinsaurekonstrukt zusatzliche Biosynthesegene des Fettsaure- oder i^l^Z^ 
S:2f t ^""l^'^n ^er Gruppe der l!:oeS.^::sTLT"^' 

l^^ZT A-s-Desaturase-. A-s-Desatuase-. A-g-Desaturase-. ^-12- 
Desaturase-, A-S-Etongase-. A-6-Elongase- Oder A-Q-Etongase. 

l^wLT^'^^'it''^ Nuklelnsaure nach den Ansprflchen 1 bis 3 Oder ein 
Genkonstrukt nach den Anspruchen 5 bis 7. 

iT^^Jfnf A°^"^T^"®'^'^^"'^"^^^^ enthaltend mindestens eine Nukleinsau- 

r r rv^zr b^A^^^^^^^ ^-^--^ - ~en sr ^ 

^^^^^^^^^^^^^ 

TVansgener nicht-humaner Organismus nach Anspruch 9 Oder 10 wobei der 
Organismus eine Pflanze 1st. ' ^^"^ 

Verfahren zur Herstellung mehrfach ungesSttlgter Fettsauren in einem Oraanis 
mus. dadurch gekennzelchnet. dass das Verfahren folgende Sch^Zmf^T 

a) Bnbrlngen mindestens einer NukleinsSuresequenz in den Organismus mH 

ZZS^ ^' ^^O- 5 Oder NO 7 

dargestewen Sequenz. die fur ein Polypeptid mit einer Acyl- 

CoAiLysophospholipid-AcyltransferaseakHvitSt codiert; otter 

< ^ch ate EraS^^^^^ Nukleinsauresequenz in den Organismus. die 

NO ? slo rn MO J *?9en®"®rten genetischen Codes von der in SEQ ID 
NO. 1, SEQ ID NO: 3. SEQ ID NO: 5 Oder SEQ ID NO- 7 enthaltend*.n 
dierenden Sequenz ablerten ISsst, oder enthaltenden co- 

T^nT^^f^rt^""^^ SEQ ID NO: 1. SEQ ID NO- 

3 SEQ ID NO: 5 Oder SEQ ID NO: 7 dargestellten Nukleinsauresequenz in 
M^:"'' Polypeptide mit der In SEQ ID NO: 2 S?q "d no 

col^Zn ' T ^^"^ ''^^ « clargestellten AmlnoSures^-inz 

ID NO S q^^.'^I^'mS^"' ^° AminosaureebenTr^rt SEQ 

ID NO. 2, SKJ ID NO: 4. SEQ ID NO: 6 oder SEQ ID NO: 8 aufweteen und 

weTsenZr '"'■'^^^^^ 
d) kultMeren und emten des Organismus. 

'Verfahren zur Herstellung mehrfach ungesattigter Fettsauren nach Ansomch 12 
dadurch gekennzeichnet. dass zusatzlich zu den unter (a) bis aeT^nn^ln ' 
r^bratr T"^^" ^'^^^ Nukleinsaureseque™d^^^^^^^^^^ 
e,ngeb,acht wurden. d.e f Or Polypeptkle des FettsSure- oder LIpidstoff^^eTseis 



3. 



14. 

io 
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ausgew§hlt aus der Gruppe Acyl-CoA-Dehydrogenase(n). Acyl-ACP[= acyl car- 
rier protein]-Desaturase(n), Acyl-ACP-Thio6sterase(n). Fettsaure-Acyl- 
Transferas©(n), FettsSure-Synthase(n), Fettsaure-Hydroxylase(n). Acetyl- 
Coenzym A-Carboxylase(n). Acyl-Coenzym A-Oxldase(n). Fettsaure- 
-OesaturaseCn). Fettsaure-Acetylenasen. Upoxygenasen, Trlacylglycerol- 
Lipasen, Allenoxid-Synthasen, Hydroperoxid-Lyasen oder Fettsaure- 
Bongase(n) codleren. 

Verfahren zur Herstellung mehrfach ungesatUgter Fettsauren nach Anspruch 12 
Oder 13. dadurch gekenr)zelchnet. dass zusStzlich zu den unter (a) bis (c) ge- 
nannten Nukleinsauresequenzen weitere Nukleinsauresequenzen In den Orga- 
nismus eingebracht wurden, die fOr Polypeptide ausgewahit aus der Gruppe A-4- 
Desaturase-. A-5-Desaturase-, A-6-Desaturase-. A-S-Desatuase- 
Desaturase-. A-12-Desaturase-, A-5-Hongase-. A-6-EIongase- oder A-9- 
Elongaseaktlvltat codieren. 

verfahren zur Herstellung mehrfach ungesatUgter FettsSuren nach den AnsprO- 
Chen 12 bis 14, dadurch gekennzeichnet, dass als Substrat der Acyl-CoA-Lyso- 
phospholipid-Acyltransferasen Cie-. Cir, oder Caa-FettsSuren venwendet 
'werden. 

1 6. Verfahren zur Herstellung mehrfach ungesattigter Fettsauren nach den AnsprCi- 
20 Chen 12 bis 15, dadurch gekennzeichnet. dass die mehrfach ungesSttlgten Fett- 

sauren aus dem Organlsmus In Fonn eines Ols. Lipids oder einer f reien Fettsau- 
re isoliert werden. 



15 16. 



17. 

25 



Verfahren zur Herstellung mehrfach ungesattigter Fettsauren nach den AnsprO- 
chen 12 bis 16. dadurch gekennzetohnet. dass die im Verfahren hergestellte 
mehrfach ungesSttiglen Fettsaure eine Cis-, C«,- Oder C^a-Fettsauren mit min- 
destenszwei Doppelblndungen im Molekul ist 

1 8. Verfahren zur Herstellung mehrfach ungesattigter Fettsauren nach den Anspru- 
chen 12 bis 17. dadurch gekennzeichnet. dass im Verfahren eine mehrfach un- 
gesattlgte Fettsaure ausgewahit aus der Gruppe Dihomo-y-linolensaure, Arachi- 
donsaure Eisosapentaensaure. Docosapentaensaure und Docosahexaensaure 
hergesteilten wird. 

19. Verfahren zur Herstellung mehrfach ungesattigter Fettsauren nach den AnsprO- 
Chen 12 bis 18, dadurch gekennzeichnet. dass der Organlsmus ein Mikroorga- 
nismus. em nicht-humanes Tier oder eine Pflanze ist. 

35- - 20. Verfahren zur Herstellung mehrfach ungesattigter Fettsauren nach den AnsprQ- 
• ..Chen 12 bis 19. dadurch gekennzeichnet. dass der Organismus eine transgene 
rtianze ist. 



30 
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21. 



Verfahren zur Herstellung mehrfach ungesattigter Fettsauren nach den AnsprO- 
chen 12 bis 20, dadurch gekennzeichnet. dass die transgene Pflanze eine 6l- 
fruchtpflanze isL 



^. 22. Ol. LIpide Oder FettsSuren oder eIne Fraktlon davon. hergestellt durch das Ver- 
fahren nach einem der Anspruche 12 bis 21 . 

. 23. 6l-, Upid- Oder Fettsaurezusammensetzung. die mehrfach ungesattigter FettsSu- 
ren hergestellt nach einem Verfahren nach einem der AnsprOche 12 Ws 21 um-= 
fasst und von transgenen RIanzen stammt. 

24. Verwendung von 6i, Uplde oder Fettsturen hergesteiit nach einem Verfahren 
nach emem der Anspruche 12 bis 21 oder Ol-. Lipid- oder Fettsaurezusammen- 
setzung gemSB Anspmch 23 in Futter, Nahrungsmittein, Kosmetika oder Phar- 
ma^utiio. 
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Rgur 1: Aminosaure-Sequenzvergleich von C. elegans LPLATs (Ce-T06E8.1 und 
^ F59F4.4) mit der M musculus LPAAT (Mm-NP061 350). 



101 



Mcn-NPOeiBSO 
Ce-T06E8-1 
Ce-F59F4 . 4 



Mcn-]srP061350 
Ce-T06<E8 .1 
Ce-F59F4.4 



]X&ti-NP061350 

Ce-T06E8.1 

Ce-F59F4.4 



]v&n-NP061350 
Ce-T06E8 . 1 
Ce-F59F4 . 4 



MII-NP061350 
Ce-T06E8.1 
Ce-F59F4 . 4 



.251 

ly&n-NPO 61350 SM^l 
Ce-T06E8.1 McSb^ 
Ce-F59F4 . 4 HQ 



MELWPGAIfl||A LLLLI^LLis l|SwFCSSSAK 
. . ..MENFtflT^I WFFI^SllF iHyNISTVCH 
1#P LAILPfglAiL iflLAQLPVIG 

51 

PVCAVRGRNV ENMKlliRLLL LHAKYL 
VTMIPSWLNG KGADYji|FHSF FYW( 
LASIPFGKSP NNHFI^KIF QJ 




_ 50 
IG WpLiFLAILAI 
mbjLHGMEVC 
dngDIGGFLGG 




VE^GAHHFP PTQUx:!^{^Y 
T*I^V|yGYEKTQ VE^Asf' 
FjigRNSEILH DK^ 



100 




MEVL 
ASIW 




.c^ag 

CD *^ 




151 




>YCA smm^mnM^i 




201 




FYS 
FYS 

FYSSMk^ 



250 

FTSPgRCQ5|R ^PPpSpSGL TpHdvPaHaD 
FKND@EWfel/R SliDA^p|i^ TL^VS^SfeD 



I LTs.Msrc; 



liTIF REdSSTDGLGG GDCLKKPGGA GEARL 
KES|IT,EAQQR NATRRGETKD GKKSE 
2AHR EKIjDAEAANL NI 



^PE^SS.. KFiiSIDDHSA 



285 
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Figur.2: Fettsaureprofile von trahsgenen C13ABYS86 S. cerevislae-Zellen 
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Figur 3: Fettsaureprofile von transgenen C13ABYS86 S. cerevisjae-Zellen 
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FIgur 4: Elongation exogen applizierter 1 8:2*®" bzw. 1 8:3*® "-^^ im Anschluss an 
ihre endogene A-6-Desaturienjng (Daten aus Rg. 2 und 3). 
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%> ^9"*^ 5; Fettsaure-Profile von transgenen INVSd S. cerevisia&'ZeUen 
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Figur 6: Fettsaure-Prof ile von trarisgenen INVScI S. cerei/fe/ae-Zellen. 



CO 

c 

O) 
CO 

I 

Q 



to 

I 
CO 

CO 



CO 



o 
to 



5 



00 



< 1^ 




Retentlonszeit 



wo 2004/076617 



7/12 



PCT/EP2004/000771 



'*.».>. ^•9"'' ^-^ Acyl-CoA-Zusammenseteung transgener INVScI Hefen, die mit den Vek- 
toren pESCLeu PpD6Pse1/pYes2 (A) oder pESCLeu-PpD6-Pse1/pYes2- 
T06E8.1 (B) transformiert worden waren. 




A 
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Rgur 8: Vektorkarte von pSUN3CeLPLAT 



J\«>*I(1) 
jpvul(27) 

i ;' 
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RgurQA: Vektorkarte vori pGPTV LeB4-700 + T06E8.1 



RB 




NOS-Tenn. 

Sad (isgoQ 
T06E8.1 auspCRScript 

JPmd (11597) 
|jeB4-700 



NOS-Prom. (10397-10200) 



NP11i(10168-9367) 




pGPTV LeB4-700+T06E8.1 

13081 bp 



LB (8391-8539)^ 
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^, Figur 9B: ^^o^^rte von pGPTV USP/OCS-1,2,3 PSE1(Pp)+D6.Des(R)+2AT 



pGFTV/USP/OCS-1,2,3 PSEl (Pp) D6-Des(Pt)-2 AT(T06E8-1) 

>4S(fc(310) 
.Sad? (321) 
^- Xhd (323) 
USP- 

PSE 

Sfdr(i908) 
ocs- 

USP- 

Acyltrans- 

Hpd (3663) 
pcs- 

USP- 

D6- 

X/7?i(6007) 

SmI (6009) 
ocs- 

Sad? (6224) 
>4sd;(6227) 

NOS- 
Api (6883) 

NPTIl (10168- 




LB (8391 
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Rgur ipA: Biosynthese-Weg von LCPUFAs 



Yi8:3-CoA 




20:3-CoA 




18:1^.PC 





f 

71 8:3 ^^''^2 



-PC 



20:3A8.ii,i4_p^ 




20:4^A"'^^-PC 
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Rgur 1 0B: Blosynthese-Weg von LCPUFAs 
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SEQUENCE LISTING ■ 
<110> BASF Plant Science QnbH 

5 <120> Verfahren zur Herstellung mehrfach ungesattigter PettsSuren 
<130> " 20030015 



10 



<160> 37 

<170>. Patentin version 3.1 



<210> 1 

<211> 849 

15 <212> TSNh 

<213> Caenorhabditis elegans 

<220> 

<221> CDS 

20 <222> (1) . . (849) 

<223> Acyl^coArLysophospholipid-Acyltransferase 
I 

<400> 1 



* L- js: z s III u^ui^t^ III s 

10 

25 30 

40 45 

?S Se? Pro III ^ gat tac gtg ttt 

et lie Pro Ser Trp Leu Asn Gly Lys Gly Ala Asp Tyr Val Phe 

40 60 

ip s ^: IS ^ - - ss s s 

80 

95 

so S ffi 2^ ^^S-SS S S-Si s ^1 

110 

^ 5? ?ij 2? e s: s - - 1- - 3». 

w •'■^O 125 

2S lit fll^ 1=^ r s s jj: S= - - 

50 • 140 

aac cgt gaa cgt gcg atg get tea cr^^ rra<- = 4. 

^ »x« H,? 12 SI 5^ s: s2 SS? 



96 



144 



192 



240 



288 



336 
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160 



145 150 

aag aac aga aat ctt aaa ctt tgg gta ttt ccg gaa gga aca aga aat 528 
Lys Asn Arg Asn Leu Lys I.eu Trp Val Ehe Pro Glu Gly -Ehr Aro Asn 
5 . 165 . 170 175 

<•.,/. cgt gaa gga ggg ttc att cca ttc aag aaa gga gca ttc aat att gca 576 
Arg Glu Gly Gly Phe He Pro Phe Lys Lys Gly Ala Phe Asn He Ala 

10 "° "0 

srtt cgt gcg cag att ccc att ^tt cca gtt gta ttc tea gac tat caa 624 

val Arg Ala Gin He Pro He He Pro Val Val Phe Ser £p So 

200 205 

15 gat ttc tac tea aag cca ggc cga tkt ttc aag aat gat gga gaa ott 672 
ASE> Ehe Tyr Ser Lys Pro Gly Arg Tyx Phe Lys Asn Asp Gly Glu Val 
210 215 220 

90 fr^^ ''^^ ''''^ °tc act ctt gat 720 

20 val lle^Arg Val Leu Asp Ala He Pro Thr Lys Gly Leu Thr Leu Lp 

230 235 240 

III c^*" atg ttg gca gcc 768 

Asp val Ser Glu Leu Ser Asp Met Cys Arg Asp Val Met Leu Ala Ala 
« 245 



30 



35 



40 



45 



250 255 

tat ^ag gaa gtt act eta gaa get cag caa cga aat gcg aca egg cgt 
Tyr Lys Glu Val Thr Leu Glu Ala Gin Gin Arg Asn Ala Thr Arg Aro 
260 265 270 

gga gaa aca aaa gac ggg aag aaa tet gag taa 
Gly Glu Thr Lys Asp Gly Lys Lys Ser Glu 
275 280 

<210> 2 
<211> 282 
<212> PRT 

<213> Caenorhabditis elegans 
<400> 2 

Met Glu Asn Phe Trp Ser He Val Val Phe Phe Leu Leu Ser He Leu 
^ 5 • • 10 15 



816 



849 



50 



Phe lie Leu Tyr Asn He Ser Thr Val Cys His Tyr IVr Met Arg He 
20 .25 30 

Ser Phe TVr T?yr Phe Thr He Leu Leu His. Gly Met Glu Val Cys Val 
35 40 45 



55 Thr Met He Pro. Ser Trp Leu Asn Gly Lys Gly Ala Asp Tyr Val Phe 
50 55 gQ 

His Ser Phe Phe -Tyx Trp Cys Lys Trp Thr Gly Val His Thr Thr Val 
OO 65 70- 75 80 
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oyr Gly 5vr Glu Lys Thr Gin Val Glu Gly Pro Ala Val Val He Cys 
85 90 95 

5 Asn His Gin Ser Ser Leu .Asp He Leu Ser Met Ala Ser He Trp Pro 
3-00 105 110 

Lys Asn Cys Val Val Met Met Lys Arg He Leu Ala Tyr Val Pro Phe 
lO 115 120 125 



15 



20 



35 



40 



Phe Asn Leu Gly Ala Tyr Phe Ser Asn Thr He Phe He Asp Arg Tvr 
130 135 140 

Asn' Arg Glu Arg Ala Met Ala Ser Val Asp Tyr Cys Ala Ser Glu Met 
"5 150 155 160 

Lys Asn 'Arg Asn Leu Lys Leu Trp Val Phe Pro Glu Gly Thr Arg Asn 
• ■' 165 170 175 



25 Arg Glu Gly Gly Phe He Pro Phe Lys Lys Gly Ala Phe Asn He Ala 
180 185 190 

Val Arg Ala Gin He Pro He He Pro Val Val Phe Ser Asp Tyr Arg 
«50 195 200 205 



Asp Phe Tyr Ser Lys Pro Gly Arg Tyr Phe Lys Asn Asp Gly Glu Val 

215 220 

Val He Arg Val Leu Asp Ala He Pro Thr Lys Gly Leu Thr Leu Asp 
• 230 235 240 

Asp Val Ser Glu Leu Ser Asp Mfet Cys Arg Asp Val Met Leu Ala Ala 
245 250 255 



45 Tyr Lys Glu Val Thr Leu Glu Ala Gin Gin Arg Asn Ala Thr Arg Arg 
260 265 270 

Gly Glu Tlir Lys Asp Gly Lys Lys Ser Glu 
50 275 ■ 280 . . 

<210> 3 

<211> 849 

55 <212> DNA 

<213> Caenorhabditis elegans 

<220*. 

<221> CDS 

60 <222> (1),.(849) 

<223> Acyl-CoA: Lysophospholipid-Acyltransf erase 
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10 



<400> 3 

atg gag aac ttc tgg teg ate gtc gtg ttt ttt eta etc tea att etc 
Met Glu Asn Phe Trp Ser lie Val Val Phe Phe Leu Leu Ser lie Leu 
5 1 . 5 , 10 15 ■ 

>5,> tte att tta tat aac ata teg aea gta tgc cac tac tat atg egg att 
Phe lie Leu Tyr Asn lie Ser Thr Val Cys His Tyr Tyx Met Arg lie 
20 25 . 30 

teg ttt tat tac ttc aea att "tta ttg cat gga atg gaa gtt tgt gtt 
Ser Phe Tyr Tyr Phe Thr lie Leu Leu His 61y Met Glu Val Cvs Val 
35 40 



15 



30 



35 



50 



55 



60 



45 



aca atg ate cet tct tgg eta aat ggg aag ggt got gat tae gtg ttt 
Thr Mfet He Pro Ser Trp Leu Asn Gly Lys Oly Ala Asp Tyr Val Phe 
50 55 



^5 70 75 80 

tat gga tat gaa aaa aca caa gtt gaa ggt ccg get gta gtt att tgt 
Tyr Gly Tyr Glu Lys Thr Gin Val Glu Gly Pro Ala Val Val He Cys 
25 85 90 95 

aat 9at cag agt tct etc gae att eta teg atg gea tea ate tgg ccg 
Asn His Gin. Ser Ser Leu Asp He Leu Ser Met Ala Ser He Trp Pro 
100 105 110 



aag aat tgt gtt gta atg atg aaa cga att ctt gee tat gtt cea tte 
Lys Asn Cys Val Val Met Met Lys Arg He Leu Ala Tyr Val Pro Phe 
115 120 125 

tte aat etc gga gee tae ttt tec aac aca ate ttc ate gat cga tat 
Phe Asn Leu Gly Ala Tyr Phe Ser Asn Thr He Phe He Asp Arg Tyr 
130 135 140 



gtt cgt gcg cag att eee att att cca gt^ gta ttc tea gae tat egg 
Val Arg Ala Gin He Pro He He Pro Val Val Phe Ser Asp Tyr Arg 
155 . 200 205 

gat ttc tac tea. aag cca ggc cga tat tte aag aat gat gga gaa gtt 
Asp Phe Tyr Ser Lys Pro Gly Arg Tyr Phe Lys Asn Asp Gly Glu Val 
, 210 215 220 

gtt att cga gtt ctg gat gcg att cca aca aaa ggg etc act ctt gat 
Val lie Arg Val Leu Asp Ala He Pro lOir Lys Gly Leu -Hxr Leu Asp 
225 230 235 240 



48 



96 



144 



192 



60 

on ^""^ ^^"^ ^^Sr act ggt gtt cat aca aca gtc 240 

i^U His Ser^Plxe Phe Tyr Trp Cys Lys Trp Thr Gly Val His Thr Thr Val 



288 



336 



384 



432 



aac cgt gaa cgt gcg atg get tea gtt gat tat tgt gca tct gaa atg 480 
40 Asn Arg Glu Arg Ala Met Ala Ser Val Asp Tyr Cys Ala Ser Glu Met 

150 155 160 

aag aac aga aat ctt aaa ctt tgg gta tct ccg gaa gga aca aga aat 
Lys Asn Arg Asn Leu Lys Leu Trp Val Ser Pro Glu Gly Thr Arg Asn 
^ 165 170 175 

cgt gaa gga ggg ttc att cca ttc aag aaa gga gca ttc aat att gca 
Arg Glu Gly Gly Phe He Pro Phe Lys Lys Gly Ala Phe Asn He Ala 
180 185 190 



528 



576 



624 



672 



720 
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3/ J. J. X 

gac gtc age gag ttg tct gat atg tgt egg gac gtt atg ttg gca gee 768 
Asp Val ser Glu Leu Ser Asp Met Cys Arg Asp Val Met Leu Ala Ala 
245 250 255 

5 . tat aag gaa gtt act eta gaa get cag caa cga aat geg aca egg cgt 816 
Tyr Lys Glu Val Thr Leu Glu Ala Gin Gin Arg Asn Ila Thr Arg Arg 
260 265 270 

gga gaa aca aaa gac ggg aag aaa tet gag taa oyiq 
lO Gly Glu Thr Lys Asp Gly Lys Lys Ser Glu 
-275 2'80 

<210> 4 

15 <211> 282 

<212> PRT 

<213> Caenorhabditis elegans 



20 



<400> 4 



Mfet Glu Asn Phe Trp Ser lie Val Val Phe Phe Leu Ser lie Leu 



25 Phe lie Leu Tyr Asn He Ser Thr Val Cys His Tyr Tyr Met Ara He 
20 25 30 

Ser Phe Tyr Tyr Phe Thr He Leu Leu His Gly Met Glu Val Cys Val 
35 40 45 



Thr Met He Pro Ser Trp Leu Asn Gly Lys Gly Ala Asp Tyr Val Phe 
35 " «0 



His Ser Phe Phe Tyr Trp Cys Lys Trp Thr Gly Val His Thr Thr Val 

40 



" • "70 75 80 



Tyr Gly lyx Glu Lys Thr Gin Val Glu Gly Pro Ala Val Val He Cvs 
■ 85 90 95 

45 Asn His Gin Ser Ser Leu Asp He Leu Ser Met Ala Ser He Tro Pro 
"0 105. . 110 

Lys Asn Cys Val Val Met Met Lys Arg He Leu Ala Tyr Val Pro Hie 
H5 120 125- 



Phe Asn Leu Gly Ala. Tyr Phe Ser Asn Thr He Phe He Asp Arg oyr 

55 



"0 135 140 



^n. Arg Glu Arg Ala Met Ala- Ser Val Asp Tyr Cys Ala Ser Glu 



145 150 



Met 

155 160 



60 



Lys Asn Arg Asn Leu Lys Leu Trp Val Ser Pro Glu Gly Thr Arg Asn 

170 175 
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Arg Glu Gly Gly Phe He Pro Phe Lys Lys Gly Ala Phe Asn He Ala 
. 180 185 190 



V' Val Afg Ala Gin He Pro He He Pro Val Val Phe Ser Asp Tyr Arg 
195 200 205 



Asp Phe- Tyr Ser Lys Pro Gly Arg Tyr Phe Lys Asn Asp Gly Glu Val 
210 215 220 

Val He Arg Val Leu Asp Ala He Pro Hhr Lys Gly Leu Thr Leu Asp 
225. . 230 235 240 

Asp Val Ser Glu Leu Ser Asp Met Cys Arg Asp Val Met Leu Ala Ala 
245 250 255 

Tyr Lyis Glu Val Thr Leu Glu Ala Gin Gin Arg Asn Ala Thr Arg Aro 
260 265 270 

Gly Glu Thr Lys Asp Gly Lys Lys Ser Glu 
275 280 

<210> 5 
<211> 849 
<212> DNA 

<213> Caenorhabditis elegans 
<220> 

<221> CDS 

<222> <1)..{849) 

<223> Acyl-CoA: Lysophospholipid-Acyltransf erase 

<400> 5 

atg gag aac ttc tgg teg ate gtc gtg ttt ttt eta etc tea att etc 48 
Met Glu Asn Phe Trp Ser lie Val" Val Phe Phe Leu Leu Ser lie Leu 
15 10 15 

It"" '^^^ ^^"^ ^""^ tae tat gtg egg att 96 

Phe lie Leu Tyr Asn lie Ser Thr Val Cys His Tyr Tyr Val Arg lie 
20 .25 30 

teg ttt tat tac ttc aca att tta ttg cat gga atg gaa gtt tgt gtt 144 
Ser Phe Tyr Tyr Phe Thr lie Leu Leu His Gly Met Glu Val Cys Val 
35 40 45 

5^5 x^"" l""^ l""^ ""^^ srct gat tac gtg ttt 192 

Thr Met He Pro Ser Trp Leu Asn Gly Lys Gly Ala Asp Tyr Val Phe 
' 55" 60 



cac teg ttt ttc tat tgg tgt aaa tgg act ggt gtt cat aca aca gtc 
HiS Ser Phe Phe Tyr Tip Cys Lys Trp Thr Gly Val His Thr Thr Val 
" 70 75 80 



240 
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' 100 105 

10 



i i Hf^ sr^t ccg get gta gtt att tot 288 

Tyr Gly O^r Glu Lys Thr Gin Val Glu Gly Pro Ala Val Val He Cys 
85 90 95 

aat cat cag agt tct etc :gac att eta teg atg gca tea ate taa eca 33 fi 

Asn His Gin Ser Ser Leu Asp He Leu Ser Me? ila Ser Se tS Pr? 



45 



110 



aag aat tgt gtt gta atg atg aaa cga att ctt gee tat gtt cca ttc 384 
Lys Asn cys Val Val Met Met Lys Arg He Leu Ala l^r Val Pro Phe 
•115 l20 125 

ttc aat etc gga gee tac ttt tec aac aca ate tte ate gat eoa tat 
15 130 ^ ^ iJl ^^"^ ^ 



140 



f 1 ^^"^ ""^^ aag aat gat gga gaa gtt 

^ o^'n ^ ^^'^ "^^^ ^3 ^ Asn Asp Ily 5lu vil 

210 215 220 

^^^^ ^*=a aaa ggg etc act ctt gat 
Val He .Arg Val Leu Asp Ala He Pro Thr Lys Gly Leu lUr Leu Asp 
40 230 235 24? 

gac gtc age gag ttg tet gat atg tgt egg gae gtt atg ttg gca gcc 
Asp val ser Glu Leu Ser Asp Met Cys Arg Asp Val Met Leu Ala Ala 
245 250. 255 



tat aag gaa gtt act eta gaa get cag caa cga aat geg aca egg egt 
Tyr Lys Glu Val Thr Leu Glu Ala Gin Gin Arg Asn All Thr Arg I?g 
260 265 270 



432 



480 



aac cgt gaa cgt geg atg get tea gtt gat tat tgt gca tct gaa atg 
Asn Arg Glu Arg Ala Met Ala Ser Val Asp Tyr Cys Ala Ser Glu Met 
20 ^ "° "5 160 

""^^ ttt ccg gaa gga aca aga aat 528 

Lys Asii Arg Asn Leu Lys Leu Trp Val Phe Pro Glu Gly Thr Arg Asn 
I 165 170 175 

^ It"" '^''^ ""^^ gca ttc aat att gca 576 

Arg Glu Gly Gly Phe He Pro Phe Lys Lys Gly Ala Phe Asn He Ala 
180 185 • . 190 

"^O f,*^ ""^^ ^^'^ gtt gta ttc tea gac tat egg 624 

30 val Arg Ala Gin He Pro He He Pro Val Val Phe Ser Lp Tyr 2? 

200 205 



672 



720 



768 



816 



gga gaa aca aaa gae ggg aag aaa tct gag taa oaq 
OO Gly Glu Thr Lys Asp Gly Lys Lys Ser Glu 
275 280 



<210> 6 

55 <211> 282 

<212> PRT 

<2X3> Caenorhabditis elegems 



60 



<400> 6 

Mat Glu Asn Phe Trp Ser He Val Val Phe Phe Leu Leu Ser He Leu 
1 5 10 



15 
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Phe lie Leu ^ Asn lie Ser Tbr Val Cys His Tyr oyr Val Arg He 

5 



20 25 30 



"■.if. Ser PHe Tyr Oyr Phe Thr lie Leu Leu His 61y Met Glu Val Cys Val 
35 40 45 



10 



•nor ^et. He Pro Ser Trp Leu Xsn Gly Lys Gly Ala Asp Tyr Val Phe 
50 55 60 



15 His Ser Phe Phe Tyr Trp Cys Lys Trp Thr Gly Val His Thr Thr Val 
• .70 75 go 

Tyr Gly Tyr Glu Lys Thr Gin Val Glu Gly Pro Ala Val Val He Cys 
^ ^ 85 90 95 



Asn Hi(s Gin Ser Ser Leu Asp He Leu Ser Met Ala Ser He Trp Pro 

25 



100 105 110 



30 



Lys A^n Cys Val Val Met Met Lys Arg He Leu Ala Tyr Val Pro Phe 
115 120 125 

Phe Asn Leu Gly Ala Tyx Phe Ser Asn Thr He Phe He Asp Arg Tyr 
130 135 140 *• a 



35 Asn Arg Glu Arg Ala Met Ala Ser Val Asp Tyr Cys Ala Ser Glu Met 
"5 150 155 160 

Lys Asn Arg Asn Leu Lys Leu Trp Val Phe Pro Glu Gly Thr Arg Asn 
^ 165 170 3^75 



Arg Glu Gly Gly Phe He Pro Phe Lys Lya Gly Ala Phe Asn He Ala 

45 



"0 185 190 



50 



Val Arg Ala Gin He Pro He He Pro Val Val Phe Ser Asp Tyr Arg 
135 200 205 

Asp Phe Tyr Ser Lys Pro Gly Arg Tyr Phe Lys Asn Asp Gly Glu Val 
210 215 220 



55 Val He Arg Val Leu Asp Ala He Pro Thr Lys Gly Leu Thr Leu Asp 
225 230 235 - - - 



240 



Asp val Ser Glu Leu Ser Asp Met Cys Arg Asp Val Met Leu Ala Ala 
°" 245 250 255 



wo 2004/076617 
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Tyr Lys Glu Val Thr Leu Glu Ala Gin Gin Arg Asn Ala Thr Arg Arg 
260 265 270 

5 Gly Glu Thr Lys Asp Gly Jjys Lys Ser Glu 
275 280 

<210> 7 
10 <211> 849 
• <212> DNA 

<213> Caenorhabditis elegans 

<220> 

15 <221> CDS 

<222> (1)..{849) 

<223 > Acyl-CoA : Lys ophospholipid-Acyl trans f erase 



20 <400> 7 



25 



30 



60 



atg gag aac ttc tgg teg ate gtc gtg ttt ttt eta etc tea att etc 
Met GlU Asn Phe Trp Ser He Val Val Phe Phe Leu Leu Ser He Leu 
•"■15 10 



15 



ttc att tta tat aac ata teg aea gta tgc cac tac tat atg egg att 
Phe He Leu Tyr Asn He Ser Thr Val Cys His Tyr Tyr Met i^g He 
20 ' 25 • 



30 



45 



aac cgt gaa egt geg atg get- tea gtt gat tat tgt gca tct gaa atg 
Asn Arg Glu Arg Ala Met Ala Ser Val Asp Tyr Cys Ala Ser Glu Met 

"0 160 

ttt m III f^^ f ff^^ aat 

Lys Asn Arg Asn Leu Lys Leu Trp Val Phe Pro Glu Gly Thr Arg Asn 



48 



96 



o""^ tl^ ^^"^ ^^"^ ^""^ atg gaa gtt tgt gtt 144 

Ser Phe ^ Tyr Phe Thr He Leu Leu His Gly Met Glu Val Cys ?al 
35 40 • 



192 



240 



288 



tlf r^"" l""^ l""^ ""^^ ^^Sr ggt get gat tac gtg ttt 

35 so 5^ JJ^ ^ 

nil m III 11"" l^"" ^'^^ gte 
His Ser, Phe Phe Tyr Trp Cys Lys Trp Thr Gly Val His Thr Thr Val 

40 " '^^ 75 80 

tat gga tat gaa aaa aea caa gtt gaa ggt ccg gee gta att att tot 
Tyr Gly Tyr Glu Lys Thr Gin Val Glu ciy Pro La 5a? vll xll ^ 
85 90 . 95 

45 aat cat cag ggt tct etc gae att eta teg atg gca tea ate tgg ccg 336 
Asn His Gin Gly Ser Leu Asp He Leu Ser Met Ala Ser He tS Pto 
^00 105 110 

i?n f^^ csra att ctt gcc tat gtt cca ttc 384 

50 Lys Asn Cys Val Val Met Met Lys Arg He Leu Ila Tyr-^?al lit Phe 
115 120 125 

ttc aat etc gga gcc. tac ttt tee aac aea ate ttc ate gat ega tat 
55 ^0 135 ^^"^ 



432 



480 



528 
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165 170 175 

cgt gaa gga ggg tto att cca ttc aag aaa gga gca ttc aat att gca 576 
Arg Glu Gly Gly Phe lie Pro Phe Lys Lys Gly Ala Phe Asn lie Ala 
°. . 180 185 190 

gtt c^t gcg cag att ccc att att cca gtt gta ttc tea gac tat egg 624 
Val Arg Ala Gin lie Pro lie He Pro Val Val Phe Ser Asp Tyr Arg 
195 200 ^ » 



10 
5 



205 



gat ttc- tac tea aag cca ggc cga tat ttc aag aat gat gga gaa gtt 672 
Asp Phe Tyr Ser Lys Pro Gly Arg Tyr Phe Lys Asn Asp Gly Glu Val 
210 215 220 

gtt att cga gtt ctg gat gcg att cca aca aaa ggg etc act ctt gat 720 
Val. lie Arg Val Leu Asp Ala He Pro Thr Lys Gly Leu Thr Leu Asp 

230 235 240 

« 11^ ^1 e^*" ^''^ *=srg gac gtt atg ttg gca gee 768 

.0 Asp Val ^er Glu Leu Ser Asp Met Cys Arg Asp Val Met Leu Ala Ala 
. , 245 250 255 

tat aalg gaa gtt act eta gaa get cag caa cga aat gcg aca egg cgt 816 
Tyr Lys Glu Val Thr Leu Glu Ala Gin Gin Arg Asn Ila Thr Sg Sg 
260 265 270 

gga gaa aca aaa gac ggg aag aaa tct gag taa oaq 
Gly Glu Thr Lys Asp Gly Lys Lys Ser Glu 
275 280 

<210> 8 
<211> 282 
<212> PRT 

<213> Caenorhabditis elegans 
<400> 8 

Met Glu Asn Phe Trp Ser He Val Val Phe Phe Leu Leu Ser He Leu 
1 5 10 



15 



Phe He Leu Tyr Asn He Ser Thr Val Cys His Tyr Tyr Met Arg He 
20 25 30 



Ser Phe Tyr OVr Phe Thr He Leu Leu His Gly Mtet Glu Val Qys Val 
35 40- 45 

Thr Met He Pro Ser Trp Leu Asn Gly Lys Gly Ala Asp T/r Val Phe 
50 55 60 

His ser Phe Phe Tyr Trp Cys Lys Trp Thr Gly Val His Thr Thr Val 

. 70 75 80 



Tyr Gly Tyr Glu Lys Thr Gin Val Glu Gly Pro Ala Val Val He Cys 
85 90 95 
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ASH His Gin Gly Ser Leu Asp lie Leu Ser Met Ala Ser He Trp Pro 

100 105 110 

5 Lys Asn Cys Val Val Met Met Lys Arg He Leu Ala Tyr Val Pro She 
115 120 125 

10 130 135 ^ 



15 



20 



35 



40 



Asn Arg Glu Arg Ala Met Ala Ser Val Asp Tyr Cys Ala Ser Glu Met 

150 155 150 

Lys Asn Arg Asn Leiu Lys Leu Trp Val Phe Pro Glu Gly Hir Arg Asn 
165 170 175 

Arg Glu Gly Gly Phe He Pro Phe Lys Lys Gly Ala Phe Asn He Ala 
• ^ 180 185 190 



25 Val Arg Ala Gin He Pro He He Pro Val Val Phe Ser Asp Tyr Arg 
195 200 205 

Asp Phe IVr Ser Lys Pro Gly Arg Tyr Phe Lys Asn Asp Gly Glu Val 
210 215 220 



Val He Arg Val Leu Asp Ala He Pro Thr Lys Gly Leu Thr Leu Asp 

230 235 240 

Asp Val Ser Glu Leu Ser Asp Met cys Arg Asp Val Met Leu Ala Ala 
245 250 255 

Tyr Lys Glu Val Ttor Leu Glu Ala Gin Gin Arg Asn Ala Thr Arg Arg 
260 265 270 



45 Gly Glu Thr Lys Asp Gly Lys Lys Ser Glu 
275 280 



<210> 9 

50 <211> 1578 

<212> UNA 

<213> Physcoinitrella patens 

<220> 

55 <221> CDS 

<222> (1) . . (1578) 

<2:^3> Delta-6-Desaturase 



60 



<400> 



f?^ H?*" ""^^ »src tct etc gaa gaa aac 

Met Val Phe Ala Gly Gly Gly Leu Gin Gin Gly Ser Leu Glu Glu Asn 



48 
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■ 1. 5 10 15 



10 
15 



ate gac gtc gag cac att gcc agt atg tct etc ttc age gae ttc ttc 
He Asp Val Glu His He Ala Ser Met Ser Leu Phe Ser Asp Phe Phe 
20 . 25 30 

agt tat gtg tct tea act gtt ggt teg tgg age gta cac agt ata caa 
Ser Tyr Val Ser Ser Thr Val Gly Ser Trp Ser Val His Ser He Gin 



35 40 



45 



30 



35 



50 



55 



145 150 



185 190 

get ctt ttc ctg agg gag caa ctt ttc aaa agt teg aaa ttg tae tat 
Ala Leu Phe Leu Arg Glu Gin Leu Phe Lys Ser Ser Lys Leu Tyr Tvr 
195 200 205 

gtt atg aag ctg etc acg aat gtt get att ttt get gcg age att gca 
Val Met Lys Leu Leu Thr Asn Val Ala He Phe Ala Ala Ser He Ala 
210 . 215 ■ 220 



ata ata tgt tgg age aag act att tea gcg gtt ttg get tea get tgt 
lit ^ ^ Ser Ala Val Leu Ala Ser Ala Cys 

225 ,^ 230 • 235 240 



96 



144 



cet ttg- aag egc ctg acg agt aag aag cgt gtt tog gaa age get gcc 192 
Pro Leu Lys Arg Leu Thr Ser Lys Lys Arg Val Ser Glu Ser Ala Ala 
50 55 60 

^ ^""^ agt ace cag gga 240 

Val. Gin qys He Ser Ala Glu Val Gin Arg Asn Ser Ser Thr Gin Gly 
^5 70 75 80 

on f?^ 2f® ^^'^ ^^"^ Stg aag coc acg aga ega agg 288 

20 Thr Ala ^lu Ala Leu Ala Glu Ser Val Val Lys Pro Thr A^g Arg A^g 

85 . 90 . 95 

tea tcit cag tgg aag aag teg aca eac ecc eta tea gaa gta aca ata 
ser Ser Gin Trp Lys Lys Ser Thr His Pro Leu Ser Glu Val Ala Val 
25 100 105 110 

cac aac aag eca age gat tgc tgg att gtt gta aaa aac aag gtg tat 384 
His Asn Lys Pro Ser Asp Cys Trp He Val Val Lys Asn Lys Val Tyr 
115 120 125 

gat gtt tec aat ttt gcg gae gag eat c:ce gga gga tea gtt att agt 432 
Asp Val Ser Asn Kie Ala Asp Glu His Pro Gly Gly Ser Val He Ser 
130 135 140 

*=tc tct agt ttt eat gca 480 
Thr Tyr Phe Gly Arg Asp Gly Thr Asp Val Phe Ser Ser Phe His Ala 

155 160 



dn ?? I ""^^ '^a° att ggt gae gtg gag 528 

40 Ala Ser Thr Trp Lys He Leu Gin Asp Phe Tyr He Gly Asp Val Glu 

165 170 175 

agg gtg gag ccg act cea gag ctg ctg aaa gat ttc ega gaa atg aga 576 
Arg val Glu Pro Thr Pro Glu- Leu Leu Lys Asp Phe Arg Glu Met Arg 

180 " " 



624 



672 



720 



768 



0 
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etc cac aat cag gtg ttt gag aca cgc tgg ctt aat gaa gtt gtc ggg 816 
Leu His Asn Gin Val Phe Glu Thr Arg Trp Leu Asn 61u Val ?il I?? 
260 265 270 

5 tat gtg ate ggc aac gcc jgtt ctg ggg ttt agt aca ggg taa taa aaa asA 

275 280 285 

gag aag cat aae ctt cat cat get get e.oa aat gaa tgc gat cao act 91? 
Glu Lys His Asn Leu His His iQa Ala Pro Asn Qlu C?s gS £ 
*90- 295 * 300 



tac caa eca att gat gaa gat att gat act etc cce etc att gcc tgg 
Tyx Gin Pro He Asp Glu Asp He Asp Thr Leu Pro Leu He Ala 
» 305 310 33^5 — Z 



320 



age aag gae ata ctg gcc aca gtt gag aat aag aca ttc ttg cga ate 
Ser Lys Asp He Leu Ala Thr Val Glu Asn Lys TOir Phe Leu J^g He 
0 325 330 335 

1*° ^^'^ ^^"^ °tg tta ttt ttc gcc cgt 

Leu Gin Tyx Gin His Leu Phe Phe Met Gly Leu Leu Phe Phe Ala Arg 
' 340 



960 



1008 



1056 



c^*" r"""" ^^"^ tgg aga tat acc tct aca gca gtg etc 1104 

Gly Ser Trp Leu Phe Trp Ser Trp Arg l^yr Thr Ser Ibr Ila vS. LeS 
. 355 360 365 

tea cct gtc gae agg ttg ttg gag aag gga act gtt ctg ttt cac tac 1152 
Ser Pro Val Asp Arg Leu Leu Glu Lys Gly Thr Val Leu Phe His Ty? 
370 375 380 

*5JC tat ctt etc cot ggt tgg aag eca 1200 
Phe Trp Phe Val Gly Thr Ala Cys Tyr Leu Leu Pro liy tS Pro 

tta gta tgg atg gcg gtg act gag etc atg tec ggc atg ctg ctg ggo 1248 
Leu val .Trp Mfet Ala Val Thr Glu Leu Met Ser Gly Mel Leu LeJ lly 
405 410 415 

1^1 f srtt tat aat teg tct 1296 

Phe val Phe Val Leu Ser His Asn Gly Met Glu Val Tyr Asn Ser Ser 
420 425 430 

aaa gaa ttc gtg agt gca cag ate gta tee aca egg gat ate aaa gga 1344 
Lys Glu Phe Val Ser Ala Gin He Val. Se^ Thr Arg Lp He Lys lly 
435 440 445 ' ^ 

aac ata ttc aac gae tgg ttc act ggt ggc ctt aac agg caa ata gag 1392 
Asn He Phe Asn Asp Trp- Phe Thr Gly Gly Leu Asn A?i..Gln lie lln 
450 455 460 

cat cat ctt ttc eca aca atg cce agg cat aat tta aac aaa ata gca 1440 
Hxs Hxs Leu Phe Pro Thr Met Pro Arg His Asn Leu Asn Lys He Sa 

470 475 480 

cct aga gtg gag gtg ttc tgt- aag aaa cao ggt ctg gtg tac gaa aac 1488 
Pro Atg val Glu Val Phe Cys Lys Lys His %Z Le? 

485 490 495 



1536 
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505 



gtc gcg gag get gcg gca gag cag cat get ace acc aat taa 
Va.1 Ala mil aia -n-i-. ... ^ ^y*^ t:aa 

Ser 
525 



^ ^ , =^ ^ ^o-t get acc acr* arr^- 

Val Ala Glu Ala Ala Ala Glu Gin His Ila ^ ^ 

^. . 515 . ^ 



<210> 10 

<211> 525 

10 <212> PRT 

<213> Physcomitrella patens* 



<40a> 10 

15 Ifet val Phe Ala Gly Gly Gly Leu Gin Gin Gly Ser I^u Glu Glu Asn 



10 



15 



20 



He ASP val Glu His He Ala Ser Met Ser Leu Phe Ser Asp Phe Phe 
" 25 30 



ser Tyir Val Ser Ser Thr Val Gly ser Trp Ser Val His Ser He Gin 
25 *° 45 

Pro Lgu Lys Arg Leu Tbr Ser Lys Lys Arg Val Ser Glu Ser Ala Ala 

55 60 

30 

val Gin Cys He Ser Ala Glu Val Gin Arg Asn Ser Ser Thr Gin Gly 

^° 75 80 

35 oanr Ala Glu Ala Leu Ala Glu Ser Val Val Lys Pro Itor Arg Arg Arg 

ser Ser Gln Trp Lys Lys Ser Thr His Pro Leu Ser Glu Val Ala Val 

105 2,10 

His Asn Lys Pro Ser Asp Cys Trp He Val. Val Lys Asn Lys Val Tyr 
45 "0 125 

Asp val ser Asn Phe Ala Asp Glu His Pro Gly Gly Ser Val He Ser 

135 140 

50 

Thr Tyr Phe Gly Arg Asp Gly Thr Asp Val. Phe Ser Ser" Phe His Ala 



55^ Ala ser Thr Trp L^ He Leu Gin Asp Phe Tyr He Gly Asp Val Glu 



170 



175 



60 ""^^ ""'^ iTo ''^^ J*!^ Met Arg 



185 



•1578 



190 
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Ala Leu Phe Leu Arg Glu Gin Leu Phe Lys Ser Ser Lys Leu Tvr Tyr 
195 200 205 

yal Met Lys Leu Leu Thr Asn Val Ala lie Phe Ala Ala Ser lie Ala 
210 215 220 

lie lie Cys Trp Ser Lys Thr He Ser Ala Val Leu Ala Ser Ala Cys 
225 230 235 240 

Met Met Ala Leu Cys Phe Gin Gin Cys Gly Trp Leu Ser His Asp Phe 
245 250 255 

■ Leu His Asn Gin Val Phe Glu Thr Arg Trp Leu Asn Glu Val Val Gly 
260 265 270 

Tyr Val lie Gly Asn Ala Val Leu Gly Phe Ser Thr Gly Trp Trp Lvs 
■ I 275 280 285 

Glu Lys His Asn Leu His His Ala Ala Pro Asn Glu Cys Asp Gin Thr 
290 295 300 

Tyr Gin Pro He Asp Glu Asp He Asp Thr Leu Pro Leu He Ala Txx> 
305 310 315 320 

Ser Lys Asp He Leu Ala Thr Val Glu Asn Lys Thr Phe Leu Arg He 
325 330 335 

Leu Gin Tyr Gin His Leu Phe Phe Met Gly Leu Leu Phe Phe Ala Arg 
340 345 



Gly Ser Trp Leu Phe Trp Ser Trp Arg Hyr Thr Ser Thr Ala Val Leu 
355 360 365 



Ser Pro Val Asp Arg Leu Leu Glu Lys Gly Thr Val Leu Phe His Tvx 
370 375 ... 380 



Phe Trp Phe Val Gly Thr Ala Cys Tyr Leu Leu Pro Gly Trp Lys Pro 
385 390- 395 400 



Leu Val Trp M6t Ala. Val Thr Glu Leu Met Ser Gly Met Leu Leu Gly 
405 410 

Ph^ Val Phe Val Leu" Ser His Asn Gly Met Glu Val Tyr Asn Ser Ser 
420 425 430 



Lys Glu Phe Val Ser Ala Gin He Val Ser Thr Arg Asp He Lys Gly 
435 440 445 
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^It ^ Arg Qln He Glu 

450 455 



His Hfs Leu Phe Pro Thr Met Pro Arg His Asn Leu Asn Lys He Ala 

470 475 480 



Pro J^g. Val Glu Val Phe Cys Lys Lys His Gly Leu Val Tyr Glu Asp 
485 490 495 

Val Ser lie Ala Thr Gly Thr Cys Lys Val Leu Lys Ala Leu Lys Glu 
500 505 510 



Val Ala Glu Ala Ala Ala Glu Gin His Ala Tbr Thr Ser 



.515 



520 



525 



<210> ( 11 

<211> 1192 

<212> UNA 

<213> Physcoiaitrella patens 

<220>' 

<221> CDS 

<222> (58).. (930) 

<223> Delta-6-Elongase 



<400> 11 

ctgcttcgtc tcatcttggg ggtgtgattc gggagtgggt tgagttggtg gagcgca 57 

atg gag gtc gtg gag aga ttc tac ggt gag ttg gat ggg aag gtc teg " 105 
Mfet Glu. val val Glu Arg Phe Tyr Gly Glu Leu Lp oiy LyJ vll III 
15 10 15 

cag ggc gtg aat gca ttg ctg ggt agt ttt ggg gtg gag ttw aco aat i^-* 
Gin Gly val Asn Ala Leu Leu Gly Ser Phe lly vJ. Ill 2S ^ Hp " 
20 25 . 30 

ftf* ^^"^ sac agt ccc aca ccc ate 201 

oair Pro Thr Thr Lys Gly Leu Pro Leu Val Asp Ser Pro Thr Pro Se 
35 40 45 

gtc etc ggt gtt tct gta tac ttg act att gtc att gga ggg ctt ttg 249 
Val Leu Gly Val Ser Val Tyr Leu Thr He Val He §ly ^y Leu £eS 
^" 55 60 

tgg ata aag goc agg gat ctg aaa ccg cgc gee teg gag cea ttt ttg 297 
Trp He Lys Ala Arg Asp Leu Lys Pro Arg Ala Ser Glu Pro Phe Leu 
" - 70 75 go 

ct9 caa get ttg gtg ctt gtg cac aao ctg ttc tgt ttt gcg etc agt 345 
Leu dOn Ala Leu Val Leu Val His Asn Leu Phe qys Phe III Leu Ser 
»5 90 95 

f^^ ^^"^ ffct att acc tgg egg tac 393 

Leu Tyr Met Cys Val Gly He Ala Tyr Gin Ala He Thr A?g I^r 
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105 
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110 



tct etc tgg ggc aat gca tac aat cct aaa cat aaa gag ata aca att 
Ser Leu Trp Gly Asn Ala Tyr Asn Pro Lys His Lys all Se? Ill lie 
^ . . 115 - 

ctg gtr& tac ttg ttc tac atg tct aag tac gta aaa thn 
I.U Val z.eu Phe Tyr Ser I,yl ^ ^ l^p ^ 



0 



5 



140 



^J"* ^'''^ ^Src acc agg caa ata age ttc etc cac 

val Ile.Met lie Leu Lys Arg Ser Thr Arg Gin lie sir Phe lln hTs 

150 

gtt tat cat cat tct tea att tec etc att tgg tao act at■^ r,^^ 
Val.OVr His His Ser Ser He Ser Leu He tS ^ Hi Se Hi Ts 

3^75 

cac get cct ggc ggt gaa gca tat tgg tct gcg get eta aar- t-oa rrcr. 
Hxs Ala ^ro Qly Gly Glu Ala Tyr Ser 111 S S.y 
. , 185 190 

gtg cat gtt etc atg tat gcg tat tac ttc ttg get gee tac eht 
val HXS val Leu Met OVr Ala Tyr Tyr Phe LeS g° 2g 

"5 200 • 205 

agt age cca aag tta aaa aat aag tac ett ttt tgg ggc aga tac tttr 
ser ser Pro Lys Leu Lys Asn Lys Tyr Leu Phe T?? S?J 

" 215 220 

|J Sn ^ Sf s v^! ?s s 

230 235 240 

tac gae atg aaa aeg aat gcg cca tat cca caa tgg ctg ate aaa at^ 
IVr ASP Met Lys Thr Asn Ala Pro T^r Pro Gin tS LeJ Se SI Se 
245 250 255 

t!^ i^*" ^"^^ ''^^ c^^^ ttt ott ttc ggc aat ttt tac 

Leu Phe ^ jyr Met He Ser Leu Leu Phe Leu Phe l?J Sn p2 

265 270 

vff f^* ''^'t gac gga aag caa aag gga get aaa 

val Gin Lys Tyr He Lys Pro Ser Asp Gly LyI Gin LyJ S?? ^ 

280 285 

act gag tga gctgtatcaa gccatagaaa ctctattatg ttagaacctg 
290 

aagttggtgc tttcttatct ccacttatct tttaagcagc atcagttttg aaatgatgtg 
tgggcgtggt ctgcaagtag tcatcaafcat aatcggcctg agcacttcag atggattgtt 
agaacatgag taaaagcggt tattacggtg tttattttgt accaaatcac cgcacgggtg 
aat,tgaaata tttcagattt gatcaatttc atctgaaaaa aa 



441 

489 

537 

585 

633 

681 

729 

777 

825 

873 

921 

970 

1030 
1090 
1150 
1192 



<210> 12 
<211> 290 
<212> PRT 
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<213> Physcoinitrella patens 
<400> 12 

5 Met Glu Val Val Glu Arg.Phe OVr Gly Glu Leu Asp Gly Lys Val Ser 
'1 5 10 15 

Gin Gly Val Asn Ala Leu Leu Gly Ser Phe Gly Val Glu Leu Thr Asp 
10 20 25 30 

-Hir Pro Thr Thx Lys Gly Leu Pro Leu Val Asp Ser Pro Thr Pro lie 
15 ■ 

val" Leu Gly Val Ser Val Tyr Leu Thr lie Val lie Gly Gly Leu Leu 
50 55 60 

20 

Trp Ile^Lys Ala Arg Asp Leu Lys. .Pro Arg Ala Ser Glu Pro Phe Leu 
65 ' 70 75 80 

t 

25 Leu Gin Ala Leu Val Leu Val His Asn Leu Phe Pys Hie Ala Leu Ser 

85 90 95 

Leu OVr Mfet Cys Val Gly lie Ala Tyr Gin Ala lie Thr Trp Arg Tyr 
30 100 105 110 

Ser Leu Trp Gly Asn Ala Tyr Asn Pro Lys His Lys Glu Met Ala lie 
35 "5 



40 



Leu Val Tyr Leu Phe Tyr Met Ser Lys Tyr Val Glu Phe Met Asp Thr 
130. 135 140 

Val lie Met Xle Leu Lys Arg Ser Thr Arg Gin lie Ser Phe Leu His 
145 150 155 160 



45 val Tyr His His Ser Ser lie Ser Leu lie Trp Trp Ala lie Ala His 

165 170 175 

His Ala Pro Gly Gly Glu Ala Tyr Trp Ser Ala Ala Leu Asn Ser Gly 
^ 180 185 . » 190 

Val His val Leu Met Tyr Ala Tyr Tyr Phe Leu Ala Ala Cys Leu Aro 
55 195 200 205 

tv. 

Ser Ser Pro Lys Leu Lys Asn Lys rPyr Leu Phe Trp Gly Arg Tyr Leu 
210 215 220 



60 



Thr Gin Phe Gin Met Phe Gin Phe MSt Leu Asn Leu Val Gin Ala Tyr 
225 230 235 240 
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Tyr Asp Met Lys Thr Asn Ala Pro Tyr Pro 61n Trp Leu He Lys He 
245 250 255 



10 



".^ Leu Ebe Tyr Tyr Mfet He Ser Leu Leu Phe Leu Khe Gly Asn Phe Tvr 
260 265 270 

Val Gin. Lys Tyr He Lys Pro Ser Asp Qly Lys Sin Lys Gly Ala Lys 
275 280 285 



15 Thr Glu 
290 



<210> 13 
20 <211> 1410 
<212> I&tA 

<213> 'Phaeodactylum tricomutum 

I 

<220> 
25 <221> CDS 

<222> (1)..(1410) 

<223>^ Delta-5-Desaturase, 



30 <400> 13 

atg get ccg gat gcg gat aag ctt cga caa cgc cag acg act gcg gta 48 
Met Ala Pro Asp Ala Asp Lys Leu Arg Gin Arg Gin Thr Thr Ala Val 
15 10 15 

35 gcg aag cac aat get get acc ata teg acg cag gaa cgc ctt tgc agt 96 
Ala Lys His Asn Ala Ala Thr He Ser Thr Gin Glu Arg Leu cjs Ser 
20 25 30 

ctg tct teg etc aaa ggc gaa gaa gtc tgc ate gac gga ate ate tat 144 
40 Leu Ser Ser Leu Lys Gly Glu Glu Val Cys He Asp Gly He He Tyr 
35 40 45 

gac etc caa tea ttc gat eat cce ggg ggt gaa acg ate aaa atg ttt 192 

Ai; ^ ^^"^ ^ His. Pro Gly Gly Glu Thr He Lys Met Phe 

^ 50 55 gQ 

ggt ggc aac gat gte act gta cag tac aag atg att cac ccg tac cat 240 
Qly Gly Asn Asp Val Thr Val Gin Tyr Lys Met He His Pro Tyr His 
50 80 

ace gag aag cat ttg gaa aag atg aag cgt. gtc ggc aag gtg acg gat 288 
Thr Glu Lys His Leu Glu Lys Met Lys Arg Val Gly Lys Val Thr Asp 
85 . 90 



55 



95 



111 w!? 1^° f^^ ^""^ ^^'^ =9° ate aaa 336 

Phe Val qys Glu Tyr Lys Phe Asp Thr Glu Phe Glu Arg Glu He Lys 
100 105 110 



384 
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20 



%^ It It ^""^ ^^"^ gcc att ttc ttc tac ctg 432 

Gly Trp Phe Phe Arg Ala Phe Cys Tyr He Ala He Phe Phe lyr Leu 
"° 135 

5 cag tac cat tgg gtc acc.acg gga acc tct tgg eta eta acc ata acc Afln 
Gin OVr His Trp Val Thr-^ Gly Thr Ser tS LeS LeS tl Sa 
*" -^^^ 150 155 

m i^*^ S?^ ^J'^ "^^"^ ""^^ ^'^^ atg aat gtc cag cac gat gcc 528 

10 Tyr Gly He Ser Gin Ala Met He Gly Met Asn ?al GlI His Lp Ma 

165 • 170 

Stf r?^ t^" o^'' '''^^ *^9g gtc aac gac atg eta ggc 576 

Asn His Gly Ala Vhr Ser Lys Arg Pro Trp Val Asn Asp Mfet Leu Gly 
180 185 190 

etc ggt gcg gat ttt att ggt ggt tec aag tgg etc tgg cag gaa caa 624 
Leu Gly Ala Asp Phe He Gly Gly Ser Lys Trp Leu tS Gin llu atl 

200 205 

cac tgg'' acc cac cac get tac acc. aat cac gcc gag atg gat ccc aat fi75 
His Tr^ Thr His His Ala Tyr Thr Asn His Ila GlJ Me? Sp So K 
2J(0 215 220 

IV^ 2?^ aac gac tat ccc ttg gat 720 

Ser Phe Gly Ala Glu Pro Met Leu Leu Phe Asn Asp Tyr Pro Leu Sp 
• 230 . -235 240 

cat ccc get cgt acc tgg eta cat cgc ttt caa gea ttc ttt tac atg 768 
His Pro Ala Arg Thr Trp Leu His Arg Phe Gin Ala Phe Phe Tyr Mfe? 

245 . 250 255 

Pro Val Leu Ala Gly Tyr Trp Leu Ser Ala Val Phe Asn Pro Gin He 
260 265 270 

ctt gac etc cag caa cgc ggc gca ctt tec gtc ggt ate cgt etc gac 864 
Leu ASP Leu Gin Gin Arg Gly Ala Leu Ser Val liy He ^g Leu Sp 
275 280 285 

aac get ttc att cac teg cga cgc aag tat gcg gtt ttc tgg egg get <iT> 
Asn Ala Phe He His Ser Arg Arg Lys Tyr 111 Phe S S 
290 295 300 



gtg tac att gcg gtg aac gtg att get eeg ttt tac aca aac tec ggc 
Val Tyr He Ala Val Asn Val He AU Pro Phe Tyr Thr Asn Ser III 

310 315 



etc gaa tgg tec tgg cgt gtc ttt gga aac ate atg etc atg ggt gtg 
Leu Glu Trp Ser Trp Arg Val Phe Gly Asn He Met Leu Met Gly Val 
325 330 



335 



f 1? o*"^ f ?f ^ ^""^ ^^"^ ^'^t teg ttg teg cac aat ttc 
Ala Glu Ser Leu Ala Leu Ala Val Leu Phe Ser Leu Ser His Asn Phe 
340- 345 



350 



960 



1008 



1056 



ga.a tec gcg gat cgc gat eeg acc gcc oca ctg aaa aag aeg gga gaa 1104 
Glu ^Ser Ala Asp Arg Asp Pro Thr Ala Pro Leu Lys Lys Th? liy 
355 360 365 

cca gtc gac tgg ttc aag aca cag gtc gaa act tec tgc act tac ggt 1152 
Pro val Asp Trp Phe Lys Thr Gin Val Glu Thr Ser Cys Thr OVr Gly 
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370 375 . 380 

gga ttc ctt tec ggt tgc ttc acg gga ggt etc aae ttt cag gtt gaa 1200 
Gly Phe Leu Ser Gly Qys Phe Hir Gly Gly Leu Asn Plie Gin Val Glu 
385 390 . 395 400 

>> cac carb ttg ttc cca cgc atg age age get tgg tat eee tac att gee 1248 
His His Leu Phe Pro Arg Met Ser Ser Ala Trp Tyr Pro Tyr He Ala 
405 410 415 

ccc aag.gtc cgc gaa att tgc gee aaa cac ggc gtc cac tac gee tac 1296 
Pro Lys Val Arg Glu He Cys Ala Lys His Gly Val His" Tyr Ala Tyr 
420 425 430 

tac ccg tgg ate cac caa aac ttt etc tec ace gtc cgc tac atg cac 1344 
Tyr Pro Trp He His Gin Asn Phe Leu Ser Thr Val Arg Tyr Met His 
435 440 445 

gcg gee ggg ace ggt gcc aac tgg cgc cag atg gee aga gaa aat eee 1392 
20 Ala Ala Gly Thr Gly Ala Asn Trp Arg Gin Met Ala Arg Glu Asn Pro 
450 455 460 

ttg acq: gga egg geg taa 1410 
Leu Thr Gly Arg Ala 
25 465 



10 



15 



<210> 14 

<211> 469 

30 <212> PRT 

<213> Phaeodaetylum tricornutum • 

<4ao> 14 

35 Met Ala Pro Asp Ala Asp Lys Leu Arg Gin Arg Gin Thr Thr Ala Val 
15 10 15 

Ala Lys His Asn Ala Ala Thr He Ser Thr Gin Glu Arg Leu Cys Ser 
40 20 25 30 



45 



50 



Leu Ser Ser Leu Lys Gly Glu Glu Val Cys He Asp Gly He He Tyr 
35 .40 ■ ' 45 

Asp Leu Gin Ser Phe Asp His Pro Gly Gly Glu Thr He Lys Met Phe 
SO 55 . 60- 

Gly Gly Asn Asp Val Thr Val Gin Tyr Lys .Met He His Pro Tyr His 
65 70 75 80 



55 Thr Glu Lys His- Leu Glu Lys Met Lys Arg Val Gly Lys Val Thr Asp 

85 90 95 

*.** 

Phe Val cys Glu Tyr Lys Phe Asp Thr Glu Phe Glu Arg Glu He Lys 
60 100 105 110 



I. 
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Arg Glu yal Phe Lys lie Val Arg Arg 61y Lys Asp Phe Gly Thr Leu 
115 120 

5 Gly Trp Phe Phe Arg Ala. Phe Cys Tyr He Ala He Phe Phe Tyr Leu 
130 135 140 

10 ^ "^"^ ^^"^ ^ ^ ^^"^ l-eu Leu Ala Val Ala 

150 ^ 155 igo 

IVr Gly He Ser Gin Ala Met He Gly Met Asn Val Gin His Asp Ala 
15 . "0 175 

Asn His Gly Ala Thr Ser Lys Arg Pro Trp Val Asn Asp M6t Leu Gly 
180 185 190 

20 

Leu Gly 'Ala Asp Phe He Gly Gly . Ser Lys Trp Leu Trp Gin Glu Gin 
■ ' 1" 200 205 

I 

25 His Trp Thr His His Ala Tyr Thr Asn His Ala Glu Met Asp Pro Asp 

215. 220 

30 Itl '^^'^ ^^"^ Asn Asp Tyr Pro Leu Asp 

225 230 235 240 

His Pro Ala Arg Thr Trp Leu His Arg Phe Gin Ala Phe Phe TVr Met 
35 250 255 



40 



Pro val Leu Ala Gly Tyr Trp Leu Ser Ala Val Phe Asn Pro Gin He 
260 265 270 

Leu Asp Leu Gin Gin Arg Gly Ala Leu Ser Val Gly He Arg Leu Asp 
275 280 285 



45 Asn Ala Phe He His Ser Arg Arg Lys Tyr Ala Val Phe Trp Arg Ala 

295 300 

SO Xtl ^ « OVr Thr Asn Ser Gly 

**** juo 310 215 



320 



Leu Glu Trp Ser Trp Arg Val Phe Gly Asn He Met Leu Met Gly Val 
55 ...^^^ "° 335 

^ Ala Glu ser Leu Ala" Leu Ala Val Leu Phe Ser Leu Ser His Asn Phe 
340 345 



60 

Glu Ser Ala Asp Arg Asp Pro Thr Ala Pro Leu Lys Lys Thr Gly Glu 
355 360 365 
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Pro val ASP Trp Phe Lys -Ehr Gin Val Glu -Ehr Ser Cys Thr Tyr Gly 
5 375 380 

Sly Phe Leu Ser Gly Cys Phe Thr Gly Gly Leu Asa Phe Gin Val Glu 

390 395 

10 

• His His .Leu Phe Pro Arg Met Ser Ser Ala Trp Tyr Pro lyr He Ala 

15 Pro Lys Val Arg Glu He Cys Ala Lys His Gly Val His oyr Ala ^^yr 

425 430 

20 ''^ 21 ^ ^ Met His 

r «40 445 

Ala Alj Gly Thr Gly Ala Asn Trp Arg Gin Ifet Ala Arg Glu Asn Pro 

25 



30 



35 



40 



Leu Thr Gly Arg Ala 
465 



<210> 15 

<211> 3598 

<212> DNA 

<213> artificial sequence 



<220> 

<221> misc_f eature 



<400> 15 

tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60 

45 cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120 

ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180 

^ accatatgog gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc atcaggcgcc 240 

attcgccatt caggctgcgc aactgttggg aagggcgatc ggtgcgg;cc tcttcgctat 300 

tacgccagct ggcgaaaggg ggatgtgctg caaggcgatt aagttgggta acgccagggt 360 

55^ tttcocagtc acgacgttgt aaaacgacgg ccagtgaatt cggcgcgccg agctcctcga 420 

gcaaatttac acattgccac taaacgtcta aaoccttgta atttgttttt gttttactat 480 

^ gtgtgttatg tatttgattt gcgataaatt tttatatttg gtactaaatt tataacacct 540 

tttatgctaa cgtttgccaa cacttagcaa tttgoaagtt gattaattga ttctaaatta 600 
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10 



15 



20 



25 



30 



35 



40 



45 



50 



55 



tttttgtctt 
tactatagga 
5 gcaatgctgc 
\\^> taccaeacaa 
agacaacaat 
ttaaaaa^tat 
ggaggatgca 
atataatgag 
, taatttcttc 
gctttaatga 
gcacgttgta 
tctaatjgaat 
tactgattgt 
tagctgtttc 
agcataaagt 
cgctcactgc 
caacgcgcgg 
tcgctgcgct 
cggttatcca 
aaggccagga 
gacgagcatc 
agataccagg 
cttaccggat 
cgctgtaggt 
ccccccgttc 
gtaagacacg 
tatgtaggcg 
acagtatttg 



60 



tcttgatccg 
attacgcgca 
gctcagtgga 



ctaaatacat 
gaattaaagt 
atggatggca 
gatttgaggt 
gttaccacac 
tttggaaatg 
ataatgaaga 
gattttgcaa 
atagccagcc 
gatatgcgag 
aaaaacctga 
atatcacccg 
ccgtcgacga 
ctgtgtgaaa 
gtaaagcctg 
ccgctttcca 
ggagaggcgg 
cggtcgttcg 
cagaatcagg 
accgtaaaaa 
acaaaaatcg 
cgtttccccc 
acctgtccgc 
atctcagttc 
agcccgaccg 
acttatcgcc 
gtgctacaga 
gtatctgcgc 
gcaaacaai^c 
gaaaaaaagg 
acgaaaactc 



24/111 

atactaatca actggaaatg 
gagtgaatat ggtaccacaa 
tatacaccaa acattcaata 
gcatgaacgt cacgtggaca 
acaagttttg aggtgcatgc 
atttgcfatgg aagccatgtg 
aaactacaaa tttacatgca 
tactttcatt catacacact 
caccgcggtg ggcggccgcc 
acgcctatga tcgcatgata 
gcatgtgtag ctcagatcct 
ttactatcgt atttttatga 
attcgagctc ggcgcgccaa 
ttgttatccg ctcacaattc 
gggtgcctaa tgagtgagct 
gtcgggaaac ctgtcgtgcc 
tttgcgtatt gggcgctctt 
gctgcggcga gcggtatcag 
ggataacgca ggaaagaaca 
ggccgcgttg ctggcgtttt 
acgctcaagt cagaggtggc 
tggaagctcc ctcgtgcgct 
ctttctccct tcgggaagcg 
ggtgtaggtc gttcgctcca 
ctgcgcctta tccggtaact 
actggcagca gccact^rgta 
gttcttgaag tggtggccta 
tctgctgaag ccagttacct 
caccgctggt agcggtggtt 
atctcaagaa gatcctttga 
acgttaaggg attttggtca 
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taaatatttg 
ggtttggaga 
attcttgagg 
aaaggtttag 
atggatgccc 
taaaaccatg 
actagttatg 
cactaagttt 
tgcagtctag 
tttgctttca 
taccgccggt 
ataatattct 
gcttggcgta 
cacacaacat 
aactcacatt 
agctgcatta 
ccgcttcctc 
ctcactcaaa 
tgtgagcaaa 
tccataggct 
gaaacccgac 
ctcctgttcc 
tggcgctttc 
agctgggctg 
atcgtcttga 
acaggattag 
actacggcta 
tcggaaaaag 
tttttgtttg 
tcttttctac 
tgagattatc 



ctaatatttc 
tttaattgtt 
ataataatgg 
taatttttca 
tgtggaaagt 
acatccactt 
catgtagtct 
tacacgatta 
aaggcctcct 
attctgttgt 
ttcggttcat 
ccgttcaatt 
atcatggtca 
acgagccgga 
aattgcgttg 
atgaatcggc 
gctcactgac 
ggcggtaata 
aggccagcaa 
ccgcccccct 
aggactataa 
gaccctgccg 
tcatagctca 
tgtgcacgaa 
gtccaacccg 
cagagcgagg 
cactagaagg 
agttggtagc 
caagcagcag 

ggggtctgac 
aaaaaggatc 



660 
720 
780 
840 
900 
960 
1020 
1080 
1140 
1200 
1260 
1320 
1380 
1440 
1500 
1560 
1620 
1680 
* 1740 
1800 
1860 
1920 
1980 
2040 
2100 
2160 
2220 
2280 
2340 
2400 
2460 
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10 



15 



20 



25 



30 



35 



ttcacctaga 
taaacttggt 
5 ctatttcgtt 
ggctt^cat 
gatttatcag 
ttatccgcct 
gttaatagtt 
tttggtatgg 
atgttgtgca 
gccgcagtgt 
tccgtaagat 
atgcggpgac 
agaactttaa 
ttaccgctgt 
tcttttactt 
aagggaataa 
tgaagcattt 
aataaacaaa 
accattatta 



40 



45 



50 



55 



60 



tccttttaaa 
ctgacagtta 
catccatagt 
ctggccccag 
caataaacca 
ccatccagtc 
tgcgcaacgt 
cttcattcag 
aaaaagcggt 
tatcactcat 
gcttttctgt 
cgagttgctc 
aagtgctcat 
tgagatccag 
tcaccagcgt 
gggcgacacg 
atcagggtta 
taggggttcc 
tcatgacatt 



25/111 

ttaaaaatga agttttaaat 
ccaatgctta atcagtgagg 
tgcctgactc cccgtcgtgt 
tgctgcaatg ataccgcgag 
gccagccgga agggccgagc 
tattaattgt tgccgggaag 
tgttgccatt gctacaggca 
ctccggttcc caacgatcaa 
tagctccttc ggtcctccga 
ggttatggca gcactgcata 
gactggtgag tactcaacca 
ttgcccggcg tcaatacggg 
cattggaaa'a cgttcttcgg 
ttcgatgtaa cccactcgtg 
ttctgggtga gcaaaaacag 
gaaatgttga atactcatac 
ttgtctcatg agcggataca 
gcgcacattt ccccgaaaag 
aacctataaa aataggcgta 
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caatctaaag 
cacctatctc 
agataactac 
acccacgctc 
gcagaagtgg 
ctagagtaag 
tcgtggtgtc 
ggcgagttac 
tcgttgtcag 
attctcttac 
agtcattctg 
ataataccgc 
ggcgaaaact 
cacccaactg 
gaaggcaaaa 
tcttcctttt 
tatttgaatg 
tgccacctga 
tcacgaggcc 



tatatatgag 
agcgatctgt 
gatacgggag 
accggctcca 
tcctgcaact 
tagttcgcca 
acgctcgtcg 
atgatccccc 
aagtaagttg 
tgtcatgcca 
agaatagtgt 
gccacatagc 
ctcaaggatc 
atcttcagca 
tgccgcaaaa 
tcaatattat 
tatttagaaa 
cgtctaagaa 
ctttcgtc 



2520 

2580 

2640 

2700 

2760 

2820 

2880 

2940 

3000 

3060 

3120 

3180 

3240 

3300 

3360 

3420 

3480 

3540 

3598 



<210> 16 
<211> 3590 
<212> DNA 

<213> artificial sequence 
<220> 

<221> misc_feature 
<400> 16 

tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat goagctcccg gagaeggtca 60 
cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120 
ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180 
accatatgcg gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc atcaggcgcc 240 
attcgccatt caggctgcgc aactgttggg aagggcgatc ggtgcgggec tcttogctat 300 
tacgccagct ggcgaaaggg ggatgtgctg caaggcgatt aagttgggta acgccagggt 360 
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5 
10 
15 
20 
25 
30 



35 



40 



45 



50 



55 



60 



tttcccagtc acgacgttgt aaaacgacgg ccagtgaatt cggcgcgccg agctcctcga 420 

gcaaatttac acattgccac taaacgtcta aacccttgta atttgttttt gttttaotat 480 

'gtgtgttatg tatttgattt gcgataaatt tttatatttg gtactaaatt tataacacct 540 

tttatgctaa cgtttgccaa cacttagcaa tttgcaagtt gattaattga ttctaaatta 600 

tttttgtctt ctaaatacat atactaatca actggaaatg taaatatttg ctaatatttc 660 

tactatagga gaattaaagt gagtgaatat ggtaccacaa ggtttggaga tttaattgtt 720 

gcaatgctgc atggatggca tatacaccaa acattcaata attcttgagg ataataatgg 780 

taccacacaa gatttgaggt gcatgaacgt cacgtggaca aaaggtttag taatttttca 840 

agacaacaat gttaccacac acaagttttg aggtgcatgc atggatgccc tgtggaaagt 900 

ttaaaaatat tttggaaatg atttgcatgg aagccatgtg taaaaccatg acatccactt 960 

ggaggatgca ataatgaaga aaactacaaa tttacatgca aetagttatg catgtagtct 1020 

atataatgag gattttgcaa tactttcatt catacacact oactaagttt tacacgatta 1080 

taatttcttc atagccagcg gatccgatat cgggcccgct agcgttaacc ctgctttaat 1140 

gagatatgcg agacgcctat gatcgcatga tatttgcttt caattctgtt gtgcacgttg 1200 

taaaaaacct gagcatgtgt agctcagatc cttaccgccg gtttcggttc attctaatga 1260 

atatatcacc cgttactatc gtatttttat gaataatatt ctccgttcaa tttactgatt 1320 

gtccgtcgac gaattcgagc tcggcgcgcc aagcttggcg taatcatggt catagctgtt 1380 

tcctgtgtga aattgttatc cgctcacaat tccacacaac atacgagccg gaagcataaa 1440 

gtgtaaagcc tggggtgcct aatgagtgag ctaactcaca ttaattgcgt tgcgctcact 1500 

gcccgctttc cagtcgggaa acctgtcgtg ccagctgcat taatgaatcg gccaacgcgc 1560 

ggggagaggc ggtttgcgta ttgggcgctc ttccgcttcc tcgctcactg actcgctgcg 1620 

ctcggtcgtt cggctgoggc gagcggtatc agctcactca aaggcggtaa tacggttatc 1680 

cacagaatca ggggataacg caggaaagaa catgtgagca aaaggccagc aaaaggccag 1740 

gaaccgtaaa aaggccgcgt tgctggcgtt tttccatagg ctccgccccc ctgacgagca 1800 

tcacaaaaat cgacgctcaa gtcagaggtg gcgaaacccg acaggactat aaagatacca 1860 

ggcgtttccc cctggaagct ccctcgtgcg ctctcctgtt ccgaccctgc cgcttaccgg 1920 

atacctgtcc gcctttctcc cttcgggaag cgtggcgctt tctcatagct cacgctgtag 1980 

gtatctcagt tcggtgtagg tcgttcgctc caagctgggc tgtgtgcacg aaccccccgt 2040 

tcagtrccgac cgctgcgcct tatccggtaa ctatcgtctt gagtccaacc cggtaagaca 2100 

cgacttatcg ccactggcag cagccactgg taacaggatt agcagagcga ggtatgtagg 2160 

cggtgctaca gagttcttga agtggtggcc taactacggc tacactagaa ggacagtatt 2220 
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5 



10 



15 



20 



25 



30 



35 



40 



45 



tggtatctgc 

cggcaaacaa 

'cagaaaaaaa 
•I- 

gaacgaaaac 
gatcctttta 
gtctgacagt 
ttcatccata 
atctggcccc 
agcaataaac 
ctccatccag 



tttgcgcaac 
I 

ggcttcattc 
caaaaaagcg 
gttatcactc 
atgcttttct 
accgagttgc 
aaaagtgctc 
gttgagatcc 
tttcaccagc 
aagggcgaca 
ttatcagggt 
aataggggtt 
tatcatgaca 



gctctgctga 
accaccgctg 
ggatctcaag 
tcacgttaag 
aattaaaaat 
taccaatgct 
gttgcctgac 
agtgctgcaa 
cagccagccg 
tctattaatt 
gttgttgcca 
agctccggtt 
gttagctcct 
atggttatgg 
gtgactggtg 
tcttgcccgg 
atcattggaa 
agttcgatgt 
gtttctgggt 
cggaaatgtt 
tattgtctca 
ccgcgcacat 
ttaacctata 



agccagttac 
gtagcggtgg 
aagatccttt 
ggattttggt 
gaagttttaa 
taatcagtga 
tccccgtcgt 
tgataccgcg 
gaagggccga 
gttgccggga 
ttgctacagg 
cccaacgatc 
tcggtcctcc 
cagcactgca 
agtactcaac 
cgtcaatacg 
aacgttcttc 
aacccactcg 
gagcaaaaac 
gaatactcat 
tgagcggata 
ttccccgaaa 
aaaataggcg 



cttcggaaaa 
tttttttgtt 
gatcttttct 
catgagatta 
atcaatctaa 
ggcacctatc 
gtagataact 
agacccacgc 
gcgcagaagt 
agctagagta 
catcgtggtg 
aaggcgagtt 
gatcgttgtc 
taattctctt 
caagtcattc 
ggataatacc 
crgggcgaaaa 
tgcacccaac 
aggaaggcaa 
actcttcctt 
catatttgaa 
agtgccacct 
tatcaqgagg 



agagttggta 
tgcaagcagc 
acggggtctg 
tcaaaaagga 
agtat'atatg 
tcagcgatct 
acgatacggg 
tcaccggctc 
ggtcctgcaa 
agtagttcgc 
tcacgctcgt 
acatgatccc 
agaagtaagt 
actgtcatgc 
tgagaatagt 
gcgccacata 
ctctcaagga 
tgatcttcag 
aatgccgcaa 
tttcaatatt 
tgtatttaga 
gacgtctaag 
ccctttcgtc 



gctcttgatc 
agattacgcg 
acgctcagtg 
tcttcaccta 
agtaaacttg 
gtctatttcg 
agggcttacc 
cagatttatc 
ctttatccgc 
cagttaatag 
cgtttggtat 
ccatgttgtg 
tggccgcagt 
catccgtaag 
gtatgcggcg 
gcagaacttt 
tcttaccgct 
catcttttac 
aaaagggaat 
attgaagcat 
aaaataaaca 
aaaccattat 



2280 

2340 

2400 

2460 

2520 

2580- 

2640 

2700 

2760 

2820 

2880 

2940 

3000 

3060 

3120 

3180 

3240 

3300 

3360 

3420 

3480 

3540 

3590 



<210> 17 

50 <211> 3584 

<212> DJSIA 

<213> artificial sequence 
<220> 

55 <221> misc^featiire 

^. <223> Sequenz stent eine pflanzliche Promotor-Terminator-Expressionska 
ssette in Vektor pUC19 dar ^"ij-^citor Jixpressxonska 



60 <400> 17 

tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 



60 
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16 
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60 



cagcttgtct 
ttggcgggtg 
5 accatatgcg 
\\'^>. attcgccatt 
tacgccagct 
tttccc^gtc 
gcaaatttac 
gtgtgttatg 
. ttt'atgctaa 
tttttgtctt 
tactatagga 
gcaatcfctgc 
taccacacaa 
agacaacaat 
ttaaaaatat 
ggaggatgca 
atataatgag 
taatttcttc 
gagatatgcg 
taaaaaacct 
atatatcacc 
gtccgtcgac 
gtgaaattgt 
agcctggggt 
tttccagtcg 
aggcggtttg 
cgttcggctg 
atcaggggat 
taaaaaggcc 
aaatcgacgc 
tccccctgga 



gtaagcggat 
tcggggctgg 
gtgtgaaata 
caggctgdgc 
ggcgaaaggg 
acgacgttgt 
acattgccac 
tatttgattt 
cgtttg'ccaa 
ctaaatacat 
gaattaaagt 
atggatggca 
gatttgaggt 
gttaccacac 
tttggaaatg 
ataatgaaga 
gattttgcaa 
atagccagca 
agacgcctat 
gagcatgtgt 
cgttactatc 
gagctcggcg 
tatccgctca 
gcctaatgag 
ggaaacctgt 
cgtattgggc 
cggcgagcgg 
aacgcaggaa 
gcgttgctgg 
tcaagtcaga 
agctccctcg 



28/111 

gccgggagca gacaagcccg 
cttaactatg cggcatcaga 
ccgcacagat gcgtaaggag 
aactgttggg aagggcgatc 
ggatgtgctg caaggcgatt 
aaaac^acgg ccagtgaatt 
taaacgtcta aacccttgta 
gcgataaatt tttatatttg 
cacttagcaa tttgcaagtt 
atactaatca actggaaatg 
gagtgaatat ggtaccacaa 
tatacaccaa acattcaata 
gcatgaacgt cacgtggaca 
acaagttttg aggtgcatgc 
atttgcatgg aagccatgtg 
aaactacaaa tttacatgca 
tactttcatt catacacact 
gatctgccgg catcgatccc 
gatcgcatga tatttgcttt 
agctcagatc cttaccgccg 
gtatttttat gaataatatt 
cgccaagctt ggcgtaatca 
caattccaca caacatacga 
tgagctaact cacattaatt 
cgtgccagct gcattaatga 
gctcttccgc ttcctcgctc 
tatcagctca ctcaaaggcg 
agaacatgtg agcaaaaggc 
cgtttttcca taggctccgc 
srsrtggcgaaa cccgacagga 
tgcgctctcc tgttccgacc 
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tcagggcgcg 
gcagattgta 
aaaataccgc 
ggtgcgggcc 
aagttgggta 
cggcgcgccg 
atttgttttt 
gtactaaatt 
gattaattga 
taaatatttg 
ggtttggaga 
attcttgagg 
aaaggtttag 
atggatgccc 
taaaaccatg 
actagttatg 
cactaagttt 
gggccatggc 
caattctgtt 
gtttcggttc 
ctccgttcaa 
tggtcatagc 
gccggaagca 
gcgttgcgct 
atcggccaac 
actgactcgc 
gtaatacggt 
cagcaaaagg 
ccccctgacg 
ctataaagat 
ctgccgctta 



tcagcgggtg 120 

ctgagagtgc leo 

atcaggcgcc 240 

tcttcgctat 300 

acgccagggt 360 

agctcctcga 420 

gttttactat 480 

tataacacct 540 

ttctaaatta 600 

ctaatatttc 660 

tttaattgtt 720 

a taat aatgg 780 

taatttttca 840 

tgtggaaagt 900 

acatccactt 960 

catgtagtct 1020 

tacacgatta 1080 

ctgctttaat 1140 

gtgcacgttg " 1200 

attctaatga 1260 

tttactgatt 1320 

tgtttcctgt 1380 

taaagtgtaa 1440 

cactgcccgc 1500 

gcgcggggag 1560 

tgcgctcggt 1620 

tatccacaga 1680 

ccaggaaccg 1740 

agcatcacaa 1800 

accaggcgtt 1860 

ccggatacct 1920 
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gtccgccttt 
cagttcggtg 
cgaccgctgc 
atcgcc?actg 
tacagagttc 
• ctgcgctctg 
acaaaccacc 
aaaaggatct 
. aaactcacgt 
tttaaattaa 
cagttaccaa 
catagtfigcc 
ccccagtgct 
aaaccagcca 
ccagtctatt 
caacgttgtt 
attcagctcc 
agcggttagc 
actcatggtt 
ttctgtgact 
ttgctcttgc 
gc tea teat t 
atccagttcg 
cagcgtttct 
gacacggaaa 
gggttattgt 
ggttcegcgc 
gacattaacc 



ctcccttcgg 
taggtcgttc 
gccttatccg 
gcagcagcca 
ttgaagtggt 
ctgaagccag 
gctggtagcg 
caagaagatc 
taagggattt 
aaatgaagtt 
tgcttaatca 
tgactccccg 
gcaatgatae 
gccggaaggg 
aattgttgcc 
gccattgcta 
ggttcccaac 
tccttcggtc 
atggcagcac 
ggtgagtact 
ccggcgtcaa 
ggaaaacgtt 
atgtaaccca 
gggtgagcaa 
tgttgaatac 
ctcatgagcg 
acatttccce 
tataaaaata 



29/111 

gaagcgtggc gctttctcat; 
gctccaagct gggctgtgtg 
gtaactatcg tcttgagtce 
etggtaacag gattagcaga 
ggcctaacta cggqtacact 
ttaccttcgg aaaaagagtt 
gtggtttttt tgtttgcaag 
ctttgatctt ttctacgggg 
tggtcatgag attatcaaaa 
ttaaatcaat ctaaagtata 
srtgaggcacc tatctcagcg 
tegtgtagat aaetacgata 
cgcgagaccc acgctcaccg 
cegagcgcag aagtggtcct 
gggaagctag agtaagtagt 
caggcatcgt ggtgtcacgc 
gatcaaggcg agttacatga 
ctccgategt tgtcagaagt 
tgcataattc tcttactgtc 
caaccaagtc attctgagaa 
tacgggataa taccgcgcca 
cttcggggcg aaaactctca 
ctcgtgcacc caactgatct 
aaacaggaag gcaaaatgcc 
tcatactett cctttttcaa 
gatacatatt tgaatgtatt 
gaaaagtgcc acctgacgtc 
ggcgtateac gaggcccttt 
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agctcacgct 
caegaacccc 
aacccggtaa 
gcgaggtatg 
agaaggacag 
ggtagctctt 
cagcagatta 
tctgacgctc 
aggatcttca 
tatgagtaaa 
atctgtctat 
cgggagggct 
gctccagatt 
gcaactttat 
tcgccagtta 
tcgtcgtttg 
tcccccatgt 
aagttggccg 
atgceatccg 
tagtgtatgc 
catagcagaa 
aggatcttac 
tcagcatctt 
gcaaaaaagg 
tattattgaa 
tagaaaaata 
taagaaacca 
cgtc 



gtaggtatct 1980 
ccgttcagcc 2040 
gacacgactt 2100 
taggcggtgc 2160 
tatttggtat 2220 
gatccggcaa 2280 
cgcgcagaaa 2340 
agtggaacga 2400 
cctagatcct 2460 
cttggtctga 2520 
ttcgttcatc 2580 
taccatctgg 2640 
tatcagcaat 2700 
ccgcctccat 2760 
atagtttgcg 2820 
gtatggettc 2880 
tgtgcaaaaa 2940 
cagtgttatc 3000 
taagatgctt '3060 
ggcgaccgag 3120 
c tttaaaagt 3180 
cgctgttgag 3240 
ttactttcac 3300 
gaataagggc 3360 
gcatttatca 3420 
aacaaatagg 3480 
ttattatcat 3540 
3584 



<2105J.' 18 
<211> 4507 
<212> DNA 

<213> artificial sequence 
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<220> 

<221> misc_featiire 
»V. <400>-*' 18 

tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60 
10 cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 
ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 
accatatgcg gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc atcaggcgcc 
attcgocatt caggctgcgc aactgttggg aagggcgatc ggtgcgggcc tcttcgctat 
tacgccagct ggcgaaaggg ggatgtgctg caaggcgatt aagttgggta acgccagggt 
tttcccagtc acgacgttgt aaaacgacgg ccagtgaatt cggcgcgccg agctcctcga . 420 
gcaaatttac acattgccac taaacgtcta aacccttgta atttgttttt gttttactat 



20 
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60 



120 
180 
240 
300 
360 



gtgtgttatg tatttgattt gcgataaatt tttatatttg gtactaaatt tataacacct 540 



480 



tttatgctaa cgtttgcoaa cacttagcaa tttgcaagtt gattaattga ttctaaatta 600 
tttttgtctt ctaaatacat atactaatca actggaaatg. taaatatttg ctaatatttc 660 
tactatagga gaattaaagt gagtgaatat ggtaccacaa ggtttggaga tttaattgtt 720 
gcaatgctgc atggatggca tatacaccaa aoattcaata attcttgagg ataataatgg 780 
^ taccacacaa gatttgaggt gcatgaacgt cacgtggaca aaaggtttag taatttttca 840 
agacaacaat gttaccacac acaagttttg aggtgcatgc atggatgccc tgtggaaagt 
ttaaaaatat tttggaaatg atttgcatgg aagccatgtg taaaaccatg acatccaott 
ggaggatgca ataatgaaga aaactacaaa tttacatgca actagttatg catgtagtct 
atataatgag gattttgcaa tactttcatt catacacact cactaagttt tacacgatta 
^ taatttcttc atagccagcc caccgcggtg ggcggccgcc tgcagtctag aaggcctcct 
gctttaatga gatatgcgag acgcctatga tcgcatgata tttgctttca attctgttgt 
gcacgttgta aaaaacctga gcatgtgtag ctcagatcct taccgccggt ttcggttcat 
tctaatgaat atatcacccg ttkctatcgt atttttatga ataatafctct ccgttcaatt 
tactgattgt ccgtcgagca aatttacaca ttgccactaa acgtctaaac ccttgtaatt 
tgtttttgtt ttactatgtg tgttatgtat ttgatttgcg ataaattttt atatttggta 
^. ctaaatttat aacacctttt atgctaacgt ttgccaacac ttagcaattt gcaagttgat 
taktfgattc taaattattt ttgtcttcta aatacatata ctaatcaact ggaaatgtaa 
atatttgcta atatttctac tataggagaa ttaaagtgag tgaatatggt accacaaggt 
ttggagattt aattgttgca atgctgcatg gatggcatat acaccaaaca ttcaataatt 



900 
960 
1020 
1080 
1140 
1200 
1260 
1320 
1380 
1440 
1500 
1560 
1620 
1680 
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cttgaggata ataatggtac cacacaagat ttgaggtgca tgaacgtcac gtggacaaaa 1740 
ggtttagtaa tttttcaaga caacaatgtt accacacaca agttttgagg tgcatgcatg 1800 

o 

'gatgccctgt ggaaagttta aaaatatttt ggaaatgatt tgcatggaag ccatgtgtaa 1860 

aaccatgaca tccacttgga ggatgcaata atgaagaaaa ctacaaattt acatgcaact 1920 

agttatgcat gtagtctata taatgaggat tttgcaatac tttcattcat acacactcac 1980 

taagttttac acgattataa tttcttcata * gccagcggat ccgatatcgg gcccgctagc 2040" 

gttaaccctg ctttaatgag atatgcgaga cgcctatgat cgcatgatat ttgctttcaa 2100 

ttctgttgtg cacgttgtaa aaaacctgag catgtgtagc tcagatcctt accgccggtt 2160 

tcggttcatt ctaatgaata tatcacccgt tactatcgta tttttatgaa taatattctc 2220 

cgttcaattt actgattgtc cgtcgacgaa ttcgagctcg gcgcgccaag cttggcgtaa 2280 

tcatggtcat agctgtttcc tgtgtgaaat tgttatccgc tcacaattcc acacaacata 2340 

cgagccggaa gcataaagtg taaagcctgg ggtgcctaat gagtgagcta actcacatta 2400 

attgcgttgc gctcactgcc cgctttccag tcgggaaacc tgtcgtgcca gctgcattaa 2460 

tgaatcggcc aacgcgcggg gagaggcggt ttgcgtattg - ggcgctcttc cgcttcctcg 2520 

ctcactgact cgctgcgctc ggtcgttcgg ctgcggcgag cggtatcagc tcactcaaag 2580 

gcggtaatac ggttatccac agaatcaggg gataacgcag gaaagaacat gtgagcaaaa 2640 

ggccagcaaa aggccaggaa ccgtaaaaag gccgcgttgc tggcgttttt ccataggctc 2700 

cgcccccctg acgagcatca caaaaatcga cgctcaagtc agaggtggcg aaacccgaca 2760 

ggactataaa gataccaggc gtttccccct ggaagctccc tcgtgcgctc tcctgttccg 2820 

accctgccgc ttaccggata cctgtccgcc tttctccctt cgggaagcgt ggcgctttct 2880 

catagctcac gctgtaggta tctcagttcg gtgtaggtcg ttcgctccaa gctgggctgt 2940 

gtgcacgaac cccccgttca gcccgaccgc tgcgccttat ccggtaacta tcgtcttgag 3000 

tccaacccgg taagacacga cttatcgcca ctggcagcag ccactggtaa caggattagc 3060 

agagcgaggt atgtaggcgg tgctacagag ttcttgaagt ggtggcctaa ctacggctac 3120 

actagaagga cagtatttgg fcatctgcgct ctgctgaagc cagttacctt cggaaaaaga 3180 

gttggtagct cttgatccgg caaacaaacc accgctggta gcggtggttt ttttgtttgc 3240 

aagcagcaga ttacgcgcag aaaaaaagga tctcaagaag atcctttgat cttttctacg 3300 

gggtctgacg ctcagtggaa cgaaaactca cgttaaggga ttttggtcat gagattatca 3360 

aaaaSrgatct tcacctagat ccttttaaat taaaaatgaa gttttaaatc aatctaaagt ' 3420 

atatatgagt aaacttggtc tgacagttac caatgcttaa tcagtgaggc acctatctca 3480 

gcgatctgtc tatttcgttc atccatagtt gcctgactcc ccgtcgtgta gataactacg 3540 



10 
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ktacgggagg gcttaccatc tggccccagt gctgcaatga taccgcgaga cccacgctca 3600 

. ccggctccag atttatcagc aataaaccag ccagccggaa gggccgagcg cagaagtggt 3660 

• octgcaactt tatccgcctc catccagtct attaattgtt gccgggaagc tagagtaagt 3720 

agttcgccag ttaatagttt gcgcaacgtt gttgccattg ctacaggcat cgtggtgtca 3780 

cgctcgtcgt ttggtatggc ttcattcagc tccggttccc aacgatcaag gcgagttaca 3840 

tgatccccca tgttgtgcaa aaaagcggtt agctccttcg gtcctccgat cgttgtcaga 3900 

agtaagttgg ocgcagtgtt atcactcatg gttatggcag cactgcataa ttctcttact 3960 

gtcatgccat ccgtaagatg cttttctgtg actggtgagt actcaaccaa gtcattctga 4020 

gaatagtgta tgcggcgaoo gagttgctct tgcccggogt caatacggga taataccgcg 4080 

ccacata^ca gaactttaaa agtgctcatc attggaaaac gttcttcggg gcgaaaactc 4140 

tcaaggatct tacogctgtt gagatccagt tcgatgtaac ccactcgtgc acccaactga 4200 

tcttcagcat cttttacttt caccagcgtt tctgggtgag caaaaacagg aaggcaaaat 4260 

gccgcaaaaa agggaataag ggcgacacgg aaatgttgaa tactcatact cttccttttt 4320 

caatattatt gaagcattta tcagggttat tgtctcatga gcggatacat atttgaatgt 4380 
atttagaaaa ataaacaaat aggggttccg cgcacatttc occgaaaagt gccacctgac 
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<210> 19 

<211> .17752 

<212> DMA 

<213> Phaeodactylum tricornutum, Physcomitrella patens 
<220> 

<221> CDS 

<222> (11543) . . (12415) . 

<223> Delta- 6-Elongase 



•<:220> 

<221> CDS 

50 <222> (13313) .. (14890) 

<223> Delta-6-DesatTirase 



<220> 

55 <221> CDS 

rv. <222> .(15791) .. (17200) 

<223> Delta-5-Desaturase 



60 <400> 19 

gatctggcgc cggccagcga gacgagcaag attggccgcc gcccgaaacg atccgacagc 



4440 



gtctaagaaa ccattattat catgacatta acctataaaa ataggcgtat cacgaggccc 4500 
tttcgtc 

35 4507 
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gcgcccagca 
tagtgggcgg 
ataatcaggc 
atgtt&ggtt 
ttctttatca 
tgacaaagtt 
gcgtagacgg 
tttactggca 
cggagaatca 
ggaatgcccg 
ccggcacgcg 
gcgaggcggg 
ctgttggggc 
ccgtt;gaaca 
ccggtccgga 
ggaggctcgt 
tgccggagcg 
ccaccgcgtc 
ccaagcctca 
gctcactgac 
ggcggtaata 
aggccagcaa 
ccgcccccct 
aggactataa 
gaccctgccg 
ccgctgcata 
tcgcacgata 
ggcgtcagcc 
ctgtccctta 
ctaccgccgg 
agggcagccc 



caggtgcgca 
tgacgtcgtt 
cgatgccgac 
tcacgtctgg 
ctgataagtt 
gcagccgaat 
tctgacgaca 
cttcaggaac 
tacgcattcg 
cagcttcagg 
accgggcgca 
tttttcggcc 
cgtgcttgag 
ggctccgctc 
cgcagcgttc 
tgtcaggaac 
caacccactc 
agacgcccgt 
cggccgcgct 
tcgctgcgct 
cggttatcca 
aaggccagga 
gacgagcatc 
agataccagg 
cttaccggat 
accctgcttc 
tacaggattt 
gggcaggata 
ttcgcacctg 
cgtaacagat 
acctatcaag 



33/111 

ggcaaattgc accaacgcat 
cgagtgaacc agatcgcgca 
agcgtcgagc gcgacagtgc 
cctccggacc agcctccgct 
ggtggacata ttatgtttat 
acagtgatcc gtgccgccct 
cgcaaactgg cggaacggtt 
aagcgggcgc tgctcgacgc 
gtgccgagag ccgacgacga 
caggcgctgc tcgcctaccg 
ccgcagatgg aaacggccga 
srgggacgccg tcaatgcgct 
gagcaggccg gcgacagcga 
tcgccgctgt tgcgggccgc 
gagcagggac tcgcggtgat 
gttgaaggac cgagaaaggg 
actacagcag agccatgtag 
agcagcccgc tacgggcttt 
cggcctctct ggcggccttc 
cggtcgttcg gctgcggcga 
cagaatcagg ggataacgca 
accgtaaaaa ggccgcgttg 
acaaaaatcg acgctcaagt 
cgtttccccc tggaagctcc 
acctgtccgc ctttctccct 
SrssrSftcatta tagcgatttt 
tgccaaaggg ttcgtgtaga 
ffsrtgaagtag gcccacccgc 
gcggtgctca acgggaatcc 
gagggcaagc ggatggctga 
gtgtactgcc ttccagacga 



acagcgccag 
0Sraggcccgg 
tcagaattac 
ggtccgattg 
cagtgataaa 
ggacctgttg 
gggggttcag 
actggccgaa 
ctggcgctca 
cgatggcgcg 
c.gcgcagctt 
gatgacaatc 
tgccggcgag 
gatagacgcc 
tgtcgatgga 
tgacgattga 
acaacatccc 
ttcatgccct 
tggcgctctt 
gcggtatcag 
ggaaagaaca 
ctggcgtttt 
cagaggtggc 
ctcgtgcgct 
tcgggaagcg 
ttcggtatat 
ctttccttgg 
gagcgggtgt 
tgctctgcga 
tgaaaccaag 
acgaagagcg 
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cagaatgcca 120 

cagcaccggc * 180 

gatcaggggt 240 

aacgcgcgga 300 

gtgtcaagca 360 

aacgaggtcg 420 

cagccggcgc 480 

gccatgctgg 540 

tttctgatcg 600 

cgcatccatg 660 

cgcttcctct 720 

agctacttca 780 

cgcggcggca 840 

ttcgacgaag 900 

ttggcgaaaa 960 

tcaggaccgc 1020 

ctcccccttt 1080 

gccctagcgt 1140 

ccgcttcctc 1200 

ctcactcaaa 1260 

tgtgagcaaa 1320 

tccataggct 1380 

gaaacccgac 1440 

ctcctgttcc 1500 

tggcgctttt 1560 

ccatcctttt 1620 

tgtatccaac 1680 

tccttcttca 1740 

ggctggccgg 1800 

ccaaccagga 1860 

attgaggaaa 1920 
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aggcggcggc 
aaatcacggg 
tgggccgcct 
tcggtgatgc 
gcaaggtcat 
aacggccggg 
gacttcgcgg 
gacgctcacc 
cgc'gccagaa 
cctcgcggaa 
cgactcaccc 
gagctggcca 
gatgtggaca 
tgacagatga 
gcacctattg 
ccgcccgttt 
aaaccttgtt 
tgccccccct 
tgcgcccctc 
ttgccgggat 
ttgacgtgcc 
gcggcctggg 
cggggccggc 
tgttcggggg 
gtatgaaaac 
ctaccaagac 
tactgataag 
ggcaaggcat 
tgcatggact 
attgggtaat 
tgtcatgcag 



ggccggcatg 
cgtcgtggac 
gggcggcctg 
cacgatcctc 
gatgggcgtg 
gggtgcgcgt 
agctggtgaa 
gggctggttg 
acgccgtcga 
aacttggccc 
ggcgcggcgt 
gcctcgcaaa 
agcctgggga 

ggggcgcgat 

acatttgagg 
ttcggccacc 
tttaaccagg 
tctcgaaccc 
ggccgcgaac 
cggggcagta 
gcaggtgctg 
tggcggcctg 
aatttttacc 
tgcgataaac 
gagaattgga 
gaagaggatg 
ataatatatc 
aggcagcgcg 
aatgcttcfaa 
gactccaact 
ctccaccgat 
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agcctgtcgg cctacctgct 
tatgagcacg tccgcgagct 
ctgaaactct ggctcaccga 
gccctgctgg cgaagatcga 
gtccgcccga gggcagagcc 
gattgcfcaag cacgtcccca 
gtacatcacc gacgagcaag 
ccctcgccgc tgggctggcg 
agccgtgtgc gagacaccgc 
tcactgacag atgaggggcg 
tgacagatga ggggcaggct 
tcggcgaaaa cgcctgattt 
taacftgccct gcggtattga 
ccttgacact tgaggggcag 
ggctgtccac aggcagaaaa 
gctaacctgt cttttaacct 
gctgcgccct gtgcgcgtga 
tcccggcccg ctaacgcggg 
ggcctcaccc caaaaatggc 
acgggatggg cgatcagccc 
gcatcgacat tcagcgacca 
cccttcactt cggccgtcgg 
ttgggcattc ttggcatagt 
ccagcgaacc atttgaggtg 
cctttacaga attactctat 
aagaggatga ggaggqagat 
ttttatatag aagatatcgc 
cttatcaata tatctataga 
acccaggaca ataaccttat 
tattgatagt gttttatgtt 
tttgagaacg acagcgactt 
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ggccgtcggc 
ggcccgcatc 
cgacccgcgc 
agagaagcag 
atgacttttt 
tgcgctccat 
gcaagaccga 
gccgtctatg 
ggccgccggc 
gacgttgaca 
cgatttcggc 
tacgcgagtt 
cacttgaggg 
agtgctgaca 
tccagcattt 
gcttttaaac 
ccgcgcacgc 
cctcccatcc 
agcgctggca 
gagcgcgacg 
ggtgccgggc 
ggcattcacg 
ggtcgcgggt 
ataggtaaga 
gaagcgccat 
tgccttgaat 
cgtatgtaag 
atgggcaaag 
agcttgtaaa 
cagataatgc 
ccgtcccagc 



cagggctaca 
aatggcgacc 
acggcgcggt 
gacgagcttg 
tagccgctaa 
caagaagagc 
gcgcctttgc 
gccctgcaaa 
gttgtggata 
cttgaggggc 
cggcgacgtg 
tcccacagat 
gcgcgactac 
gatgaggggc 
gcaagggttt 
caatatttat 
cgaagggggg 
ccccaggggc 
gtccttgcca ' 
cccggaagca 
agtgagggcg 
gacttcatgg 
gccgtgctcg 
ttataccgag 
atttaaaaag 
atattgacaa 
gatttcaggg 
cataaaaact 
ttctatcata 
ccgatgactt 
cgtgccaggt 



1980 
•2040 
2100 
2160 
2220 
2280 
2340 
2400 
2460 
2520 
2580 
2640 
2700 
2760 
2820 
2880 
2940 
3000 
3060 
3120 
3180 
3240 
3300 
3360 
3420 
3480 
3540 
3600 
3660 
3720 
3780 
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gctgcctcag 
gcagctttcc 
cgtcaaaggg 
I atacgtTgcgc 
gcgatttagc 
tgcccggctg 
cgtgttgagg 
catatcaatg 
ccatgtttta 



acgcaccacc 

r 

agcacctcaa 
tggtttcaaa 
aaaagctgtt 
cttgttataa 
taaatggcta 
gtaaaagata 
aacctatatt 
gaaaaggaca 
gaacggcatg 
gaagagtatg 
aggctctttc 
ttagccgaat 
gaagaagaca 
cccgaagagg 
gatggcaaag 
gacattgcct 
ctattttttg 
ctggatgaat 
caqcgacttc 
gggcaagggg 
cggccagacg 



attcaggtta 
cttcaggcgg 
tgacagcagg 
aacaaccgtc 
cccgacatag 
tatgcgcgag 
ccaacgccca 
attttctggt 
cggcagtgag 
ccgtcagtag 
aaacaccatc 
atcggctccg 
ttctggtatt 
ttagcttctt 
aaatgagaat 
cggaaggaat 
taaaaatgac 
tgatgctatg 
atggctggag 
aagatgaaca 
actccatcga 
tggattactt 
ctccatttaa 
aacttgtctt 
taagtggctt 
tctgcgtccg 
aqttactggg 
tgttttagta 
ttccgcatca 
tcgctggtat 
gtctacggga 
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tgccgctcaa ttcgctgcgt 
gattcataca gcggccagcc 
ctcataagac gccccagcgt 
ttccggagac tgtcatacgc 
ccccactgtt cgtccatttc 
gttaccgact gcggcctgag 
taatgcgggc tgttgcccgg 
gcgtaccggg ttgagaagcg 
agcagagata gcgctgatgt 
ctgaacagga gggacagctg 
atacactaaa tcagtaagtt 
tcgatactat gttatacgcc 
taaggtttta gaatgcaagg 
ggggtatctt taaatactgt 
atcaccggaa ttgaaaaaac 
gtctcctgct aaggtatata 
ggacagccgg tataaaggga 
gctggaagga aagctgcctg 
caatctgctc atgagtgagg 
aagccctgaa aagattatcg 
catatcggat tgtccctata 
actgaataac gatctggccg 
agatccgcgc gagctgtatg 
ttcccacggc gacctgggag 
tattgatctt gggagaagcg 
gtcgatcagg gaggatatcg 
gatcaagcct gattgggaga 
cctagatgtg gcgcaacgat 
agtgttttgg ctctcaggcc 
tcgtgcaggg caagattcgg 
ccgacttcat tgccgataag 
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atatcgcttg 
atccgtcatc 
cgccatagtg 
gtaaaacagc 
cgcgcagacg 
ttttttaagt 
catccaacgc 
gtgtaagtga 
ccggcggtgc 
atagacacag 
ggcagcatca 
aactttgaaa 
aacagtgaat 
agaaaagagg 
tgatcgaaaa 
agctggtggg 
ccacctatga 
ttccaaaggt 
ccgatggcgt 
agctgtatgc 
cgaatagctt 
atgtggattg 
attttttaaa 
acagcaacat 
gcagggcgga 
gggaagaaca 
aaataaaata 
gccggcgaca 
gaggcccacg 
aataccaagt 
gtggattatc 



ctgattacgt 
catatcacca 
cgttcaccga 
cagcgctggc 
atgacgtcac 
gacgtaaaat 
cattcatggc 
actgcagttg 
ttttgccgtt 
aagccactgg 
cccataattg 
acaactttga 
tggagttcgt 
aaggaaataa 
ataccgctgc 
agaaaatgaa 
tgtggaacgg 
cctgcacttt 
cctttgctcg 
ggagtgcatc 
agacagccgc 
cgaaaactgg 
gacggaaaag 
ctttgtgaaa 
caagtggtat 
gtatgtcgag 
ttatatttta 
agcaggagcg 
gcaagtattt 
acgagaagga 
tggacaccaa 



3840 

3900 

3960 

4020 

4080 

4140 

4200 

4260 

4320 

4380 

4440 

4500 

4560 

4620 

4680 

4740 

4800 

4860 

4920 

4980 

5040 

5100 

5160 

5220 

5280 

5340 

5400 

5460 

5520 

5580 

5640 
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5 
10 
15 
20 
25 
30 
35 

40 

45 

50 

55 



ggcaccaggc 
cccgcaagga 
cgacgcgggg 
gccccgcgaa 
gcgcgacagc 
ttcgcgtcgt 
aggaactatg 
cgaggccaag 
ttccttgttc 
ccgctctgcc 
ggtcatt£tc 
cgacg^tgac 
cgagccgatc 
ccggtattac 
cacgtccgac 
ggaccgtggc 
gtttgctggc 
ggcccgacgg 
aaccttccgc 
cggcgaagcc 
tgacctggtg 
agccagcgct 
tcagtatcgc 
ttgacaattg 
cgcgagatcc 
cacgaggaga 
ggcgcctaca 
aaggacgctc 
srcr9€rtcgccg 



60 



cgacagattc 
tcgctattct 



gggtcaaatc 
srggtgaatga 
ttttccgccg 
accttccagt 
gtgcaactgg 
ctcgaacagg 
acgaccaaga 
caggccgcgt 
gatattgcgc 
ctgttcacca 
cacgtcaaca 
gaactggtgt 
accttcacgt 
acgaaggccg 
cgcgttgggc 
aagaaaacgt 
gaccactaca 
atgttcgact 
ctcatgtgcg 
tgcgaagagt 
cattgcaaac 
ttactggcat 
tcgggacgca 
tgattaaggc 
gattgtcggc 
aaaagcccat 
tcgacggcga 
acaaggcgca 
gtatgctgct 
caacgggaat 
ggagcttgtt 
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aggaataagg gcacattgcc 
atcggacgtt tgaccggaag 
aggatgccga aaccatcgca 
ccgtcggctc gatggtccag 
ctccccctgc cctgcccgcg 
aggcg^cagg tttggcgaag 
agcgaaaaac cgccggcgag 
tgctgaaaca cacgaagcag 
csrtggccgga cacgatgcga 
cgcgcaacaa gaaaatcccg 
aggacgtgaa gatcacctac 
ggcagcaggt gttggagtac 
tctacgagct ttgccaggac 
aggaatgcct gtcgcgccta 
acctggaatc ggtgtcgctg 
cccgttgcca ggtcctgatc 
cgaaattcat atgggagaag 
atttcagctc gcaccgggag 
gatcggattc cacccgcgtg 
tgcgaggcag cggcctggtg 
gctagggcct tgtggggtca 
ttcaggaaca agcgggcact 
cggcgcgctc tacgaactgc 
tcagattcga cggcttggag 
cctgaagaaa gctccagaga 
ggaggcgttc gctgaacggt 
gatcattggg ctgtcggtct 
tctgtccggc gttttcgtgg 
gcgggcgttg ccggcgggtt 
ctggrtggatg cgcatcttca 
gtttatttcg gtctaccgcc 
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ccggcgtgag 
gcatacaggc 
agccgcaccg 
caagctacgg 
ccatcggccg 
tcgatgacca 
gacctggcaa 
cagatcaagg 
gcgatgccaa 
cgcgaggcgc 
accggcgtcg 
gcgaagcgca 
ctgggctggt 
caggcgacgg 
ctgcaccgct 
gacgaggaaa 
taccgcaagc 
ccgtacccgc 
aagaagtggc 
gaacacgcct 
gttccggctg 
gctcgacgca 
cgataaacag 
cggccgacgt 
tgttcgggtc 
tgcgagatgc 
tcaaacagga 
agcccgaaca 
tattgctcgt 
tcctcggcgc 
tgccgggcgg 



tcggggcaat 
aagaactgat 
tcatgcgtgc 
ccaagatcga 
ccgtggagcg 
tcgacacgcg 
aacaggtcag 
aaatgcagct 
acgacacggc 
tgcaaaacaa 
agctgcgggc 
cccctatcgg 
cgatcaatgg 
cgatgggctt 
tccgcgtcct 
tcgtcgtgct 
t^cgccgac 
tcaagctgga 
gcgagcaggt 
gggtcaatga 
ggggttcagc 
cttgcttcgc 
aggattaaaa 
gcaggatttc 
cgtttacgag 
cgtggcattc 
ggacggcccc 
gcgaggccga 
gatgatcgtc 
acttaatatt 
ggtcgcggcg 



5700 

5760 

5820 

5880 

5940 

6000 

6060 

6120 

6180 

6240 

6300 

6360 

6420 

6480 

6540 

6600 

6660 

6720 

6780 

6840 

6900 

6960 

7020 

7080 

7140 

7200 

7260 

7320 

7380 

7440 

7500 
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5 



10 



t5 



20 



25 



30 



35 



40 



45 



50 



55 



60 



acggtaggcg 
ccgatacgat 
gtgttgacac 
gtttceatgg 
acctttaccg 
tttgatccgc 
ctgatcggag 
acagttgttt 
. catcaggccg 
aggggagttg 
cggcttta^c 
cggtta^gcg 
tttgatcaca 
tcatccgtgt 
gagcaaagtc 
gcctgtatcg 
tggcaggata 
gacgttttta 
tgcccttcac 
gcaggcgaaa 
agaatagccc 
gaacgtggac 
tgaaccatca 
ccctaaaggg 
ggaagggaag 
gatcggtgcg 
gattaagttg 
aattaattcc 
ggtattatag 
tcaataactg 
tgtgtaatac 



ctgtgcagcc 
tgatggcggt 
caaacgcagc 
cgttcggaac 
cctggcaact 
caatcccgat 
cgggtttaac 
ccttactggg 
acagtcggaa 
atatcgtcaa 
cagcgatttc 
agaaatgaat 
ggcagcaacg 
ttcaaacccg 
tgccgcctta 
agtggtgatt 
tattgtggtg 
atgtactggg 
cgcctggccc 
atcctgtttg 
gagatagggt 
tccaacgtca 
cccaaatcaa 
agcccccgat 
aaagcgaaag 
ggcctcttcg 
ggtaacgcca 
catcttgaaa 
tccaagca&a 
attatatcag 
ataaattgat 
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gctgatggtc gtgttcatct; 
cctgggggct atttgcggaa 
gctagatcct gtcggcgtcg 
cgtgctgacc cgcaagtggc 
ggcggccgga ggacttctgc 
gcctacagga accaatgttc 
ctacttcctt tggttccggg 
ctttctcagc cccagatctg 
cttcgggtcc ccgacctgta 
cgttcacttc taaagaaata 
ctattatgtc ggcatagttc 
aagaaggctg ataattcgga 
ctctgtcatc gttacaatca 
gcagcttagt tgccgttctt 
caacggctct cccgctgacg 
ttgtgccgag otgccggtcg 
taaacaaatt gacgcttaga 
gtggtttttc ttttcaccag 
tgagagagtt gcagcaagcg 
atggtggttc cgaaatcggc 
tgagtgttgt tccagtttgg 
aagggcgaaa aaccgtctat 
gttttttggg gtcgaggtgc 
ttagagcttg acggggaaag 
sragcgggcgc cattcaggct 
ctatt:acgcc agctggcgaa 
gggttttccc agtcacgacg 
gaaatatagt ttaaatattt 
aacataaatt tattgatgca 
ctggtacatt gccgtagatg 
gatatagcta gcttagctca 
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ctgccgctct 
ctgcgggcgt 
cagcgggcct 
aacctcccgt 
tcgttccagt 
tcggcctggc 
ggatctcgcg 
gggtcgatca 
ccattcggtg 
gcgccactca 
tcaagatcga 
tctctgcgag 
acatgctacc 
ccgaatagca 
ccgtcccgga 

gggagctgtt 

caacttaata 
tgagacgggc 
gtccacgctg 
aaaatccctt 
aacaagagtc 
cagggcgatg 
cgtaaagcac 
ccggcgaacg 
gcgcaactgt 
agggggatgt 
ttgtaaaacg 
attgataaaa 
agtttaaatt 
aaagactgag 
tcgggggatc 



gctaggtagc 
ggcgctgttg 
ggcgggggcg 
gcctctgctc 
agctttagtg 
gtggctcggc 
actcgaacct 
gccggggatg 
agcaatggat 
gcttcctcag 
cagcctgtca 
ggagatgata 
ctccgcgaga 
tcggtaacat 
ctgatgggct 
ggctggctgg 
adacattgcg 
aacagctgat 
gtttgcccca 
ataaatcaaa 
cactattaaa 
gcccactacg 
taaatcggaa 
tggcgagaaa 
tgggaagggc 
gctgcaaggc 
acggccagtg 
taacaagtca 
cagaaatatt 
tgcgatatta 
cgtcgaagct 



7560 
•7620 
7680 
7740 
7800 
7860 
7920 
7980 
8040 
8100 
8160 
8220 
8280 
8340 
8400 
8460 
8520 
8580 
' 8640 

8700 

8760 

8820 

8880 

8940 

9000 

9060 

9120 

9180 

9240 

9300 

9360 
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agcttgggtc ccgctcagaa gaactcgtca agaaggcgat agaaggcgat gcgctgcgaa 9420 
tcgggagcgg cgataccgta aagcacgagg aagcggtcag cccattcgcc gccaagctct 9480 
5 tcagcaatat cacgggtagc caacgctatg tcctgatagc ggtccgccac acccagccgg 9540 
ccacasrtcga tgaatccaga aaagcggcca ttttccacca tgatattcgg caagcaggca 9600 
tcgccatggg tcacgacgag atcctcgccg tcgggeatgc gcgocttgag cctggcgaac 9660 
agttoggctg gcgcgagccc ctgatgctct tcgtccagat catcctgatc gacaagaccg 9720 
gcttccatcc gagtacgtgc tcgctcgatg cgatgtttcg cttggtggtc gaatgggcag 9780 
15 gtagccggat caagcgtatg cagccgccgc attgcatcag ccatgatgga tactttctcg 9840 
gcaggagcaa ggtgagatga caggagatcc tgccccggca cttcgcccaa tagcagccag 9900 
tcccttcccg cttcagtgac aacgtcgagc acagctgcgc aaggaacgcc cgtcgtggcc 9960 
agccacg&ta gccgcgctgc ctcgtcctgc agttcattca gggcaccgga caggtcggtc 10020 
ttgac^aaaa gaaccgggcg cccctgcgct gacagccgga acacggcggc atcagagcag 10080 
ccgattgtct gttgtgccca gtcatagccg aatagcctct ccacccaagc ggccggagaa 10140 
cctgcgtgca atccatcttg ttcaatccaa gctcccatgg gccctcgact agagtcgaga 10200 
tctggattga gagtgaatat gagactctaa ttggataccg aggggaattt atggaacgtc 10260 
agtggagcat ttttgacaag aaatatttgc tagctgatag tgaccttagg cgacttttga 10320 
acgcgcaata atggtttctg acgtatgtgc ttagctcatt aaactccaga aacccgcggc 10380 
tgagtggctc cttcaacgtt gcggttctgt cagttccaaa cgtaaaacgg cttgtcccgc 10440 
gtcatcggcg ggggtcataa cgtgactccc ttaattctcc gctcatgatc ttgatcccct " 10500 
^ gcgccatcag atccttggcg gcaagaaagc catccagttt actttgcagg gcttcccaac 10560 
cttaccagag ggcgccccag ctggcaattc cggttcgctt gctgtccata aaaccgccca 10620 
gtctagctat cgccatgtaa gcccactgca agctaqctgc tttctctttg cgcttgcgtt 10580 
ttcccttgtc cagatagccc agtagctgac attcatccgg ggtcagcacc gtttctgcgg 10740 
actggctttc tacgtgttcc gcttccttta gcagcccttg cgccctgagt gcttgcggca 10800 
^ gcgtgaagct tgcatgcctg caggtcgacg gcgcgccgag ctcctcgagc aaatttacac 10860 
attgccacta aacgtctaaa cccttgtaat ttgtttttgt tttactatgt gtgttatgta 10920 
tttgatttgc gataaatttt tatatttggt actaaattta taacaccttt tatgctaacg 10980 
tttgccaaca cttagcaatt tgcaagttga ttaattgatt ctaaattatt tttgtcttct 11040 
aaatacatat actaatctoc tggaaatgta aatatttgct aatatttcta ctataggaga llloo 
attaaagtga gtgaatatgg taccacaagg tttggagatt taattgttgc aatgctgcat 11160 
ggatggcata tacaccaaac attcaataat tcttgaggat aataatggta ccacacaaga 11220 
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tttgaggtgc atgaacgtca cgtggacaaa aggtttagta atttttcaag acaacaatgt 11280 

taccacacac aagttttgag gtgcatgcat ggatgccctg tggaaagttt aaaaatattt 11340 

5 tggaaatgat ttgcatggaa gccatgtgta aaaccatgac atccacttgg aggatgcaat 11400 

•^.V. aatgaagaaa actacaaatt tacatgcaac tagttatgca tgtagtctat ataatgagga 11460 

ttttgcaata ctttcattca tacacactca cte^agtttta caogattata atttcttcat 11520 

11572 



•15 
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agccagqcca ccgcggtgga aa atg gag gtc gtg gag aga ttc tac ggt gag 

Met Olu Val Val Glu Arg Phe Tyr Gly Glu 
1 5 10 

ttg gat ggg aag gtc teg cag ggc gtg aat gca ttg ctg ggt agt ttt 11620 
Leu Asp Gly Lys Val Ser Gin Gly Val Asn iQa LeS Leu ?5 sJr Phe 
1'5 20 25 

^ 5*"^ ^ Srgc ttg ccc etc gtt 11668 

Gly Val^Glu Leu Olxr Asp Thr Pro Tbr Thr Lys Gly Leu Pro Leu Val 
30 .. 35 40 

I 

gac agt ccc aca ccc ate gtc etc ggt gtt tct gta tac ttg act att 11716 

Asp Ser Pro Thr Pro He Val Leu Gly Val Ser Val Tyr Leu Itor He 

45 50 55 

^tI^ S?^ Srat ctg aaa ccg cgc 11764 

val lie Gly Gly Leu Leu Trp He Lys Ala Arg Asp Leu Lys Pro Arg 
6° 65 70 

gcc tog gag cca ttt ttg etc caa get ttg gtg ctt gtg cac aac ctg 11812 
Ala Ser Glu Pro Phe Leu Leu Gin Ala Leu Val Leu Val His Asn Leu 
75 80 85 90 

lit ^ f?^ ^""^ ^te get tat cag 11860 

Phe Cys Phe Ala Leu Ser Leu Tyr Met Cys Val Gly He Ala Tyr Gin 
95 100 105 

get att' acc tgg egg tac tct etc tgg ggc aat gca tac aat ect aaa 11908 
Ala He Thr Trp Arg Tyr Ser Leu Trp Gly Asn Ala Tyr Asn Pro Lys 
110 115 120 

eat aaa gag atg gcg att ctg gta tac ttg ttc tac atg tot aag tac 1195S 
Hxs Lys Glu Met Ala He Leu. Val Tyr Leu Phe Tyr Met Ser LyI Tvr 
125 130 135 

frl^ ^f^ 5*"? ^^'^ ""^^ ^9° age acc agg 12004 

Val Glu Phe Met Asp Thr Val He Met He Leu Lys Arg Ser Thr Arg 
140 145 150 

caa ata ago ttc etc cac gtt tat oat cat tct tea att tec etc att 12052 
Gin He Ser Phe Leu His Val -lyr His His Ser Ser He Ser Leu He 

. 1«0 165 170 

tgg tgg get att. get cat cac get eet ggc ggt gaa gca tat tgg tct 12100 
Trp Trp Ala He Ala His His Ala Pro Gly Gly Glu Ala Tyr Itp Ser 
. , 175- 180 185 

f?f r^^ e""* H?^ ^'^^ tat gcg tat tac ttc 12148 

Ala Ala Leu Asn Ser Gly Val His Val Leu Met Tyr Ala Tyr Tyr Phe 
190 195 200 
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rlf. til ?r tt.a aaa aat aag tac ctt 12196 
Leu Ala Ala Cys Leu Arg Ser Ser Pro Lys Leu Lys Asn LyI Tyr Leu 

215 

ttt tgg ggc agg tac ttg. aca caa ttc caa ata ttc caa ttt- ata otcr io-»iyi 

Phe T*p Gly Arg Ty. Leu. Thr Gin Phe Gin Me? P^e Sin Phe Se? Leu "^'^ 

Av&Ij OOC 



25 



30 



35 



40 



45 



50 



aac tta gtg cag get tac tac gac atg aaa acg aat gcg cca tat cca 12299 
10 Asn Leu val Gin Ala ^ Tyr Asp Met Lys Thf Asn ?ro Sr ITo 
' . • 240 • 245 250 

o?^ 1^ %T ^"^^ ^^"^ ^^"^ atg ate teg ttg ctg ttt 12340 
Gin Trp Leu He Lys He Leu Phe Oyr Tyr Met He Ser Leu Leu Pte 
255 260 265 

ctt ttc ggc aat ttt tac gta caa aaa tac ate aaa cce tct aac aaa i2^flfl 

Leu Phe Gly Asn Phe Tyr Val Gin Lys Tyr He Lys Pro Ser Sp lly "^^^ 
20 275 280 

v5f ff^ '^^^ tctagaagge ctcctgcttt 12435 

Lys Qln Lys Gly Ala Lys Thr Glu a-s^jo 

I 285 290 

aatgagatat gcgagacgcc tatgatcgea tgatatttgc tttcaattct gttgtgcacg 12495 

ttgtaaaaaa ectgagcatg tgtagctcag atecttaccg ccggtttcgg tteattctaa. 12555 

tgaatatate acccgttact atcgtatttt tatgaataat attetccgtt caatttactg 12615 

attgtccgtc gagcaaattt acaeattgee actaaaegtc taaacecttg taatttgttt 12675 

ttgttttact atgtgtgtta tgtatttgat ttgcgataaa tttttatatt tggtactaaa 12735 

tttataaeae cttttatgct aacgtttgcc aacacttagc aatttgcaag ttgattaatt 12795 

gattctaaat tatttttgtc ttetaaatae atatactaat caaetggaaa tgtaaatatt " 12855 

tgctaatktt tctactatag gagaattaaa gtgagtgaat atggtaceac aaggtttgga 12915 

gatttaattg ttgcaatgct gcatggatgg catataeace aaacatteaa taattettga 12975 

ggataataat ggtaoeacac aagatttgag gtgeatgaac gteaegtgga eaaaaggttt 13035 

agtaattttt caagaeaaca atgttaecac aeacaagttt tgaggtgcat gcatggatge 13095 

cctgtggaaa gtttaaaaat attttggaaa tgatttgeat ggaagceatg tgtaaaaeca 13155 

tgaeatecac ttggaggatg caataatgaa gaaaactaea aatttacatg caactagtta 13215 

tgcatgtagt ctatataatg aggattttgc aatactttca tteatacaca ctcactaagt 13275 

tttacaegat tataatttct tcatagccag cggatcc atg gta ttc geg ggc ggt 13330 
55 Met Val Phe Ala Gly Gly 

295 

o?^ Sf^ ^""^ °^'= ate gac gtc gag cac att 13378 
Gly TSeu Gin Gin Gly Ser Leu Glu Glu Asn He Asp Val IlS His Se • 

300 "snc 



60 310 

gcc agt atg tct etc ttc age gac ttc ttc agt tat gtg tct tea act 
Ala ser Met Ser Leu Phe Ser Asp Phe Phe Ser Tyr ?a? Se^ Ser ?SJ 



13426 
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315 320 



325 



10 



fr^^ S?*" ""^^ ttg aag cgc ctg acg 13474 

Val Gly Ser Trp Ser Val His Ser He Gin Pro Leu Lyl ^S:^ LeS Th? * 
. . "^^ .335 

S ^ o''^ ^^"^ ^"^^ ^^'^ tgt ata tea get 13522 

Ser Lys Lys Arg Val Ser Glu Ser Ala Ala Val Gin Cys He Ser Ala 

350 .355 360 

gaa gtt. cag aga aat teg agt *acc cag gga act gcg gag gca etc aca l-id-rn 
Glu val Gin Arg Asn Ser Ser Thr Gin Gly Thr 111 Itu III LeS Sa ° 
365 370 375 



15 



>0 



SI lit T^? ^'='^ tffS aaSJ aaff 13618 

Glu ser Val Val Lys Pro Thr Arg Arg Arg Ser Ser Gin Trp Lys Lys 
380 385 

1°^ f?^ ^""^ sraa gta gca gta cac aac aag oca age gat 13666 

Ser Thr Hxs Pro Leu Ser Glu Val Ala Val His Asn LyJ Pro Jer Sp 
395 400.. 

tgc tgg att gtt gta aaa aac aag gtg tat gat gtt tec aat ttt gcg 13714 
cys Trp He Val Val Lys Asn Lys Val Tyr Asp Val Ser Asn Phe 

415 420 

gac g^g cat ccc gga gga tea gtt att agt act tat ttt gga cga gac 13762 
ASP Glu Hxs Pro Gly Gly Ser Val He Ser Thr Tyr Phe liy Sg Isp 

430 435 

sr°a get tct aca tgg aaa att 
Gly Thr Asp Val Phe Ser Ser Phe His Ala Ala Ser Thr tS L^ ?le 
445 450 

ott caa gac ttt tae att ggt gae gtg gag agg gtg gag ccg act cea 
Leu Gin ASP Phe Tyr He Gly Asp Val Glu Arg ?ai llu Pr? Sr Pro 



460 465 



470 



rl^ r^^ f^^ ^^"^ ""^^ ctt ttc etg agg gag 

Glu Leu Leu Lys Asp Phe Arg Glu Met Arg Ala Leu Phe Leu Arg 

caa ctt ttc aaa agt teg aaa ttg tae tat gtt atg aag ctg etc aca 
Gin Leu Phe Lys Ser Ser Lys. Leu Tyr Tyr Val Met LyJ Leu ?S 

aat gtt get att ttt get gcg age att gca ata ata tgt tgg aac aacr 
Asn val Ala He Phe Ala Ala Ser He Ala He He cS Ser 

510 520 

act att tea gcg gtt ttg get tea get tgt. atg atg get ctg tgt ttc 
Thr He Ser Ala Val Leu Ala Ser Ala Cys Met Me? ila Le? cjs Phe 
525 530 535 

caa cag tgc gga -tgg eta tec cat gat ttt etc cac aat cag gtg ttt 
, Gin Gin Cys Gly Trp Leu Ser His Asp Phe Leu His Asn Gin Ja! Phe 
. 545 550 

gag aca cgc tgg ctt aat gaa gtt gtc ggg tat gtg ate gge aac gee 
Glu Thr Arg Trp Leu Asn Glu Val Val Gly Tyr Val He lly Asn Sa 
555 560 565 



13810 



13858 



13906 



13954 



14002 



14050 



14098 



14146 
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vll III o^*" ^ srag aag cat aac ctt cat 14194 

570 ^ ^^"^ ^ tlx ^ "^^ His Asn Leu His 

575 53Q 



■ II - - - i" - K ss s jj: i:- tti K 

595 

605 • 610 



620 625 



630 



. ttc ttc atg ggt ctg tta ttt ttc gcc cgt ggt aat hcrrr nfr^ 4- 
^ Phe ^t Gly I.U Leu Phe Phe Ila aS lly |2 2u Se S 
20 645 
age tgg'aga tat acc tct aca gca ata ctr t-ns ^ 

s,r ^ ™. L.^t ^ «j 2= «| ^ 

655 66Q 

25 ttg gag aag gga act gtt ctg ttt cac tac ttt hrrrr 

LJU Olu Ly, oay T*x V.1 Ph. hJ ^ 



14386 



14434 



14482 



675 



680 



30 iiim^'^'£^oZSi^^i^'.iv^!^^?itf^ 

685 . ggg 



3^ -2S-S?2?cT.£?222SlS^SU2S:?^?^X: 

705 "72^0 
cac aat ggg atg gag gtt tat aat teg tct aaa 

His Asn Gly M.t Glu Val ^ Asn Se? S^r Zs Phe ?a? til HI 

40 ■'^O 725 

S£ ?S S 2S g S: ^ .T. ""^ 

'^5 740 

ttc act ggt ggc ctt aac agg caa ata aaa cat r-at- r.*-*- 4.*.^ 
^ THraXy Gly Leu «„ oin He llS 2S ^ ^ 

'=» 755 

S? ^ ^ S ^J^^^ - - - - - - 

765 77Q 

51 S 15 J2 ?2 IS Se-? s'eJ S ^ 

780. 735 



s 5f 22 5: s J- It: ?s - - - 

ll! S?? «s S S ^ sS «c=«„«t ..tgegeft 1^,20 
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15 
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30 
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43/111 

810 815 

gcgagacgcc tatgatcgca tgatatttgc tttcaattct gttgtgcacg ttgtaaaaaa 14980 

5 cctgagcatg tgtagctcag atccttaccg ccggtttcgg ttcattctaa tgaatatatc 15040 

acccgttact atcgtatttt tatgaataat attctccgtt caatttactg attgtccgto 15100 

gagcaaattt acacattgcc actaaacgtc taa^cccttg taatttgttt ttgttttact 15160 

atgtgtstta tgtatttgat ttgogataaa tttttatatt tggtactaaa tttataacac 15220 

cttttatgct aacgtttgcc aacacttagc aatttgcaag ttgattaatt gattctaaat 15280 

tatttttgtc ttctaaatac atatactaat caactggaaa tgtaaatatt tgctaatatt 15340 

tcfactatag gagaattaaa gtgagtgaat atggtaccac aaggtttgga gatttaattg 15400 

ttgcaatgct gcatggatgg catatacacc aaacattcaa taattcttga ggataataat 15460 

ggtacca6ac aagatttgag gtgcatgaac gtcacgtgga caaaaggttt agtaattttt 15520 

caagaqaaca atgttaccac acacaagttt tgaggtgcat gcatggatgc cotgtggaaa 15580 

gtttaaaaat attttggaaa tgatttgceit ggaagceatg tgtaaaacca tgacatccao 15640 
ttggaggatg caataatgaa gaaaactaca aatttacatg caactagtta tgcatgtagt 
ctatataatg aggattttgc aatactttca ttcatacaca ctcactaagt tttacacgat 
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60 



15700 
15760 
15814 



tataatttct tcatagccag cagatctaaa atg get ccg gat gcg gat aag ctt 

Met Ala Pro Asp Ala Asp Lys Leu 
820 

cga caa cgc cag acg act gcg gta gco aaa eae sat- rrr.*- 

^ Gin *r jl^ ?^ 1.1 ^ IS.t L'S HI HI S: 
830 835 

2? SS'SS S - - - - |j - Ig ..0 

?K ^ s: Sp IS Se - ^ - - - - 

860 865 870 

oT. IS ^ ill Z - IS - - - - - "00. 

885 

^ ^ - 12 - - - - ..0. 

'ji |S ?s ?2 s ^: «j - IS 51 s 

, 9ia 

^ IK ^: s IS s 2s s - ?2 s 

325 930 
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55 



60 



cga ggc aag gat ttc ggt act ttg gga tgg ttc ttc cgt gcg ttt tgc 
Arg Gly Lys Asp Phe Gly Thx Leu Gly Trp Phe Phe Arg Iia Phe cS 
940 945 

tac att gcc afct ttc ttc tac ctg cag tac cat tgg gtc acc acg gga 
' Tyr He Ala lie Phe Phe Tyr Leu Gin Tyr His Trp Val Thr Ohr Gly 
^.55 960 965 

acc tct tgg ctg ctg gcc gtg gcc tac gga ate tec caa gcg atg att 
Thr Ser Trp Leu Leu Ala Val Ala Tyr Gly He Ser Gin 111 Met Xll 
• *975 980 

t^i ^^f ""^^ ""^"^ srcc aac cac ggg gcc acc tec aag cgt 

Gly Met Asn Val Gin His Asp Ala Asn His Gly Ala Thr Ser Lys Sg 
985 990 



ccd 
Pro 
1000 

ggt 

Gly 
1015 

tac 
Tyr 
1030 



tgg gtc aac gac atg 
Tarp Val Asn Asp Met 
1005 

tec aag tgg etc tgg 
Ser Lys Trp Leu Trp 



I 



1020 



eta ggc etc ggt gcg 
Leu Gly Leu Gly Ala 
1010 

cag gaa caa cac tgg 
Gin Glu Gin His Trp 
1025 



gat ttt att ggt 
Asp Phe lie Gly 



acc cac cac get 
Thr His His Ala 



acc aat cac gcc gag atg gat ccc gat age ttt ggt gcc gaa 
Thr Asn Hxs Ala Glu Met Asp Pro Asp Ser Phe Gly Ala Glu 
1035 1040 



l""^ t^I f ""^^ ^^"^ ^^"^ ttg gat cat ccc get cgt 

fn?«= ^^"^ Ilis Pro Ala Arg 

J-0«5 1050 1055 

^ ""f^ ^"^^ ""^^ tac atg ccc gtc ttg 

Thr Trp Leu His Arg Phe Gin Ala Phe Phe Tyr Met Pro Val LeS 

1060 1065 1070 



get 
Ala 
1075 

etc 
Leu 
1090 



gga tac tgg ttg tec 
Gly Tyr Trp Leu Ser 
1080 

cag caa cgc ggc gea 
Gin Gin Arg Gly Ala 
1095 



get gtc ttc aat cca 
Ala Val Phe Asn Pro 
1085 

ctt tec gtc ggt ate 
Leu Ser Val Gly lie 
1100 



get ttc att cac teg cga cgc aag tat gcg gtt 
Ala Phe lie His Ser Arg Arg Lys Tyr Ala Val 
1105 1110 ' • m5 



caa att ctt gac 
Gin He Leu Asp 



cgt etc gac aac 
Arg Leu Asp Asn 



ttc tgg egg get 
Phe Trp Arg Ala 



fr ? i ^^"^ ^tg att get ccg ttt tac aca aac tec 

val ivr He Ala Val Asn Val He Ala Pro Phe Tyr Thr Asn sSr 
1120 1125 1130 



ggc etc gaa tgg tec tgg 
Gly Leu Glu' Trp Ser Trp 
1135 1140 

ggt gtg gcg gaa teg etc 
Gly >.Val Ala Glu Ser Leu 
1150 1155 



cgt. gtc ttt gga aac ate atg etc atg 
Arg Val Phe Gly Asn He Met Leu Met 
1145 

gcg ctg gcg gtc ctg ttt teg ttg teg 
Ala Leu Ala Val Leu Phe Ser Leu Ser 
1160 



cac aat ttc gaa tec gcg 
His Asn Phe Glu Ser Ala 



gat cgc gat ccg ace 
Asp Arg Asp Pro Thr 



gcc cca ctg aaa 
Ala Pro Leu Lys 



16198 



16246 



16294 



16342 



16387 



16432 



16477 



16522 



16567 



16612 



16657 



16702 



16747 



16792 



16837 



16882 



wo 2004/076617 



1165 



45/111 



PCT/EP2004/000771 



1170 



1175 



10 



t5 



20 



25 



118.5 2190 

|» Si'^Z IS £ !^ I- SS £ - s 



30 



•"•^■^^ 1220 

S ill SI ttt C 2° 'f 

. 1225 • 1230 Jjjg Cys Ala 

aaa cac ggc gtc cac tac oec tac han *- 

Hi., ox. Hi. S I- - - - 

. , 1250 

1255 1260 ^ Ala 

1265 

s IS s? ^ r °» 

1270 ^ ^-^^ ^ Gly Arg Ala 

•^^^^ 1280 



16927 



16972 



17017 



17062 



17107 



17152 



17197 



35 



40 



45 



50 



55 



60 



17250 
17310 
17370 
17430 
17490 



t« .gatctgcca soatcgatco cs^gccitag cctgctttaa ts,g.t.t,o 
»agacc=ta tgatcgcatg atatttgctt t=a,««gt t^,c.=«t ,«aa.«„„ 
t»a,ca«.g tagctcagat cctaccgcc g«tt<,,«t c.««.at» a.t.t.t<»c 
cc«ta«at =,tat«tta t„,t.a«. t=tcc«tc. atttactg.t t„c=„c,a 
c„„c™„ gcgcctcta, a^atcat, .a„ca„t= ctccttcac 
«t,«„t= t«ca«tcc aaactaaa, ^^^^^^^^^^ ^^^^^ 

taacgtgact cccttaatto .ccgctcat, atca..„,t c«ttcc<=g= c„c.„tt. l,„o 
««atca« .tat.tt.,= ,g„aaa=ct aagagaaaa, a,=„ttatt 1,„0 

•.aataatc, ,atat«a.a a.,,c„gaa ^^^^^ 
atgccaacca cagggttccc ca 

17752 

<210> 20 
<211> 290 
<212> PRT 

<213> Phaeodactylmn tricomutum, Physcomitrella patens 
<400> 20 

Met Glu Val Val Glu Arg Ph& 'Pvr- nt.r r 

^ 5 ^ Glu Leu Asp Gly Lys Val Ser 

15 
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Glix Gly Val Asn Ala Leu Leu Gly Ser Phe Gly Val Glu Leu rmr Asp 

5 Thr Pro Thr Thx Lys Gly Leu Pro Leu Val Asp Ser Pro -Ehr Pro He 

40 . 45 

10 ""^^ ""^^ ""^^ ^^"^ ""^^ "-^^ ^ -^^^ val He Gly Gly Leu Leu 
. 55 60 

Trp lie Lys Ala Arg Asp Leu Lys Pro Arg Ala Ser Glu Pro Phe Leu 
•15 75 80 



20 



Leu Gin Ala Leu Val Leu Val His Asn Leu Phe Cys Phe Ala Leu Ser 
85 90 95 

Leu ly/Met Cys Val Gly He Ala Tyr Gin Ala lie Thr Trp Arg Tyr 



25 ser Leu Trp Gly Asn Ala Tyr Asn Pro Lys His Lys Glu Met Ala He 
1" 120 125 

^ Leu Val Tyr Leu Phe Tyr Ifet Ser Lys Tyr Val Glu Phe Mfet Asp Thr 



Val He Met He Leu Lys Arg Ser Vhx Arg Gin He Ser Phe Leu His 
35 160 



val Tyr His His Ser Ser He Ser Leu He Trp Trp Ala He Ala His 
165 3^75 

40 

His Ala Pro Gly Gly Glu Ala Tyr Trp Ser Ala Ala Leu Asn Ser Gly 



185 



190 



45 val His Val Leu Met Tyr Ala ^ Tyr Phe Leu Ala Ala Cys Leu Arg 

50 ^^"^ 2lS ^° """^ ""^ "-^^ Arg Tyr Leu 

" ■ 215 220 

Thr Gin Phe Gin Mfet Phe Gin Phe Met Leu Asn Leu Val Gin Ala Tyr 
55 "° "5 240 

Tirr ASP Met Lys Thr Asn Ala Pro Tyr Pro Gin Trp Leu He Lys He 
245 250 255 

60 

Leu Phe Tyr Tyr Met He Ser Leu Leu Phe Leu Phe Gly Asn Phe Tyr 
260 265 270 
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Val Gin Lys Tyr He Lys Pro Ser Asp Gly Lys Gin Lys Gly Ala Lys 
5 " 285 

v^.^,> Thr Glu 
290 

10 

<210> .21 
<211> *525 
<212> PRT 

<213> Pl^aeodactylum tricornutum, Physcamitrella pat^^ 
<400> 21 

M^t val Mie Ala Gly Gly Gly Leu Gin Gin Gly Ser Leu Glu Glu Asn 
20 15 

lie Asp val Glu His He Ala Ser Met Ser Leu Phe Ser Asp Phe Phe 

' .25 3Q 

25 

ser Tyr Val Ser Ser Thr Val Gly Ser Trp Ser Val His Ser He Gin 



40 



45 



30 Pro Leu Lys Arg Leu -Ttr Ser Lys Lys Arg val Ser Glu Ser Ala Ala 

55 60 

35 ?f ^'-'^ ser Ser Thr om Gly 



'^^ 80 



Tbr Ala. Glu Ala Leu Ala Glu Ser Val Val Lys Pro -Thr Arg Arg Arg 
40 50 95 

ser ser Gin Trp Lys Lys Ser Thr His Pro Leu Ser Glu Val Ala Val 



105 



110 



45 

His Asn Lys Prp Ser Asp Cys Trp He Val Val Lys Asn Lys Val Tyr 



120 3^25 



60 ASP val ser Asn Phe Ala Asp Glu His Pro Gly Gly Ser- Val He Ser 



140 



Thr avf Phe Gly Arg Asp Gly Thr Asp Val Phe Ser Ser Phe His Ala 
^ 160 

Ala Ser Thr Trp Lys He Leu Gin Asp Phe Tyr He Gly Asp Val Glu 
60 "0 175 

Arg val Glu Pro Thr Pro Glu Leu Leu Lys Asp Phe Arg Glu Met Arg 
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180 185 



190 



Ala Leu She Leu Arg Glu Gin Leu Phe Lys Ser Ser Lys Leu Tyr Tyr 
°. , "5 . . 200 205 



10 



15 



val Met Lys Leu Leu Thr Asn Val Ala He Phe Ala Ala Ser He Ala 

215 220 

lie Ile'cys Trp Ser L^ Thr He Ser Ala Val Leu Al^ Ser Ala Cys 

Met Met Ala Leu Cys Phe Gin Gin Cys Gly Trp Leu Ser His Asp Phe 
245 250 255 



20 Leu His Asn Gin Val Phe Glu Thr Arg Trp Leu Asn Glu Val Val Gly 
260 265 270 

I 

25 ^ ""^^ lit '^'^ ""^^ ^"^^ ""^^ Thr Gly Trp Trp Lys 

280 285 



ito ^'^^ cys Asp Gin Thr 

30 



295 



^ Gin Pro He Asp Glu Asp He Asp Thr Leu Pro Leu He Ala Trp 
^ 310 

35 

ser Lys Asp He Leu Ala Thr Val Glu Asn Lys Thr Phe Leu Arg He 



325 330 



335 



40 Leu Gin Tyr Gin His Leu Phe Phe Met Gly Leu Leu Phe Phe Ala Arg 

345 350 

Gly Ser Itp Leu Phe Trp Ser. Trp Arg Tyr" Thr Ser Thr Ala Val Leu 

ser Pro Val Asp Arg Leu Leu Glu Lys Gly Thr Val Leu Phe His Tyr 
50 • ^ 380 

Phe Trp Phe Val Gly ^ Ala Cys Tyr Leu Leu Pro Gly Trp Lys Pro 

395 400 



55 

- Ala val Thr Glu Leu Met Ser Gly Met Leu Leu Gly 

^OS 410 415 



60 Phe val Phe Val Leu Ser His Asn Gly Met Glu Val ryr Asn Ser Ser 



420 425 



430 
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Lys Glu Phe Val Ser Ala Gin lie Val Ser Thr Arg Asp lie Lys Gly 
435 440 445 

5 

• • Asn He Ehe Asn Asp Txp' Phe Thr Gly Gly Leu Asn Ara Gin He Glu 
460 455 460 

10. His His Leu Phe Pro Thr Met Pro Arg His Asn Leu Asn Lys He Ala 
. . 470 • 475 480 

Pro Arg Val Glu Val Phe Cys Lys Lys His Gly Leu Val Tyr Glu Asp 
485 490 495 



Val Ser He Ala Thr Gly Thr Cys Lys Val Leu Lys Ala Leu Lys Glu 

20 



500 505 510 



Val Ala Glu Ala Ala Ala Glu Gin His Ala Thr Thr Ser 
I 515 520 525 

25 

<210> 22 
<211> 469 
<212> PRT 

30 Phaeodactylrm tricomutum, Physcomitrella patens 

<400> 22 



35 



Met Ala Pro Asp Ala Asp Lys Leu Arg Gin Arg Gin Thr Thr Ala Val 
1 -5 10 



15 



40 



Ala Lys His Asn Ala Ala Thr He Ser Thr Gin Glu Arg Leu Cys Ser 
20 25 30 

Leu Ser Ser Leu Lys Gly Glu Glu Val Cys He Asp Gly He He Tyr 
35 40 45 

45 Asp Leu Gin Ser Phe Asp His Pro Gly Gly Glu Thr He Lys Met Phe 
50 55 60 

Gly Gly Asn Asp Val Thr Val Gin Tyr Lys Met He His Pro Tyr His 
W 65 70 . 75 



80 



Thr Glu Lys His Leu Glu Lys Met Lys Arg Val Gly Lys Val Thr Asp 

55 



85' 9o" 95 



60 



Phe val cys Glu Tyr Lys Phe Asp Thr Glu Phe Glu Arg Glu He Lys 
100 105 110 

Arg Glu Val Phe Lys He Val Arg Arg Gly Lys Asp Phe Gly Thr Leu 
115 120 125 
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61y Trp Phe Phe Arg Ala Phe Cys Tyr He Ala lie Phe Phe Tyr Leu 



140 



Gin Tyr His Trp Val Thr Thr Gly Thr Ser Trp Leu Leu Ala 



10 



3^45 ~ — — ■'■^i' -ueu Axa Val Ala 

•••=0 155 

Tyr Gly. He Ser Gin Ala Met "He Gly Met Asn Val Gin His Asp Ala 
165 170 



15 Asn His Gly Ala Thr 



180 ^^"^ ^"^^ "^"^ Asp Met Leu Gly 

185 190 



Leu Gly Ala Asp Phe He Gly Gly Ser Lys Trp Leu Trp Gin Glu Gin 
^195 200 205 



His Trp Thr His His Ala Tyr Thr Asn His Ala Glu 



25 



210 



215 



220 



Met Asp Pro Asp 



ser Phe Gly Ala Glu Pro Met Leu Leu Phe Asn Asp Tyr Pro Leu Asp 

235. 240 



30 



His Pro Ala Arg Thr Trp Leu His Arg Phe Gin Ala Phe Phe Tyr 

245 — — 



250 



Met 



255 



35 Pro val Leu Ala Gly ^ Trp Leu Ser Ala Val Phe Asn Pro Gin lie 



265 



270 



40 



Leu ASP Leu Gin Gin Arg Gly Ala Leu Ser Val Gly He Arg Leu Asp 



280 



285 



45 



Asn Ma Phe He His Ser ^g Arg Lys Tyr Ala Val Phe Trp Arg Ala 



300 



50 



val Tyr He Ala Val Asn Val He Ala Pro Phe Tyr Ohr Asn Ser Gly 

315 320 

Leu Glu Trp Ser Trp Arg Val Phe Gly Asn He Met Leu Met Gly Val 



330 



335 



55^ Ala Glu ser Leu -Ala Leu Ala Val Leu Phe Ser Leu Ser His Asn Phe 



345 



350 



60 



Glu Ser Ala Asp Arg Asp Pro Thr Ala Pro Leu Lys Lys Thr Gly Glu 



360 



365 
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Pro Val Asp Trp Phe Lys Thr Gin Val Glu Thr Ser Cys Thr Tyr Oly 

375 380 

^. . Sc ^ ^ ^^"^ ^ Leu Asn Phe Gin Val Glu 

. 395 400 



10 



15 



20 



His His Leu Phe Pro Arg Met Ser Ser Ala Trp Tyr Pro Tyr lie Ala 
405 410 415 

Pro Lys Val Arg Glu lie Cys Ala Lys His Gly Val His Tyr Ala Tvr 
420 425 430 

Tyi^ Pro Trp lie ffis Gin Asn Phe Leu Ser Thr Val Arg Tyr Met His 
435 440 445 

Ala Ala 'Gly Thr Gly Ala Asn Trp..Arg Gin Met Ala Arg Glu Asn Pro 
450 455 

25 Leu Thr Gly Arg Ala 
465 

<210> 23 
30 <211> 2 6 
<212> DNA 

<213> artificial sequence 

<400> 23 
35 gaattcggcg cgccgagctc ctcgag 

<210> 24 

<211> 265 

40 <212> vmi 

<213> artificial sequence 

<400> 24 

^ ccaccgcggt gggcggccgc ctgcagtcta gaaggcctcc tgctttaatg agatatgcga 60 
gacgcctatg atcgcatgat atttgctttc aattatgttg tgcacgttgt aaaaaacctg 120 
agcatgtgta gctcagatcc ttaccgccgg tttcggttca ttctaatgaa tatatcaccc 180 

50 gttactatcg tatttttatg aataatattc tccgttcaat ttactg^ttg tccgtcgacg 
aattcgagct cggcgcgcca agctt 



55 <210> 25 
tv. <211> 257 
<212> DNA 

<2132>'- artificial sequence 
60 <400> 25 

ggatccgata tcgggcccgc tagcgttaac cctgctttaa tgagatatgc gagacgccta 



26 



240 
265 



60 
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tgatcgcatg atatttgctt tcaattctgt tgtgcacgtt gtaaaaaacc tgagcatgtg 
tagctcagat ccttaccgcc ggtttcggtt cattctaatg aatatatcac ccgttactat 
5 cgtattttta tgaataatat tctccgttca atttactgat tgtccgtcga cgaattcgag 
ctcggegcgc caagctt 



10 



15 



20 



25 



30 



35 



40 



45 



50 



55 



60 



<210> 26 
<211> 5410 
<212> DNA 

<213> artificial sequence 
<400> 26 

ttttggaaat gatttgcatg gaagccatgt gtaaaaccat 
aataatgaag aaaactacaa atttacatgc aactagttat 
ggattttgca atactttcat tcatacacac tcactaagtt 

catagccagc ggatccgata tcgggcccgc tagcgttaac 

•I 

gagacgccta tgatcgcatg atatttgctt tcaattctgt 
tgagcatgtg tagctcagat ccttaccgcc ggtttcggtt 
ccgttactat cgtattttta tgaataatat tctccgttca 
gcaaatttac acattgccac taaacgtcta aacccttgta 
gtgtgttatg tatttgattt gcgataaatt tttatatttg 
tttatgctaa cgtttgccaa cacttagcaa tttgcaagtt 
tttttgtctt ctaaatacat atactaatca actggaaatg 
tactatagga gaattaaagt gagtgaatat ggtaccacaa 
gcaatgctgc atggatggca tatacaccaa acattcaata 
taccacacaa gatttgaggt gcatgaacgt cacgtggaca 
agacaacaat gttaccacac acaagttttg aggtgcatgc 
ttaaaaatat tttggaaatg atttgcatgg aagcc^tgtg 
ggacrgatgca ataatgaaga aaactacaaa tttacatgca 
atataatgag gattttgcaa tactttcatt catacacact 
taatttcttc atagccagca gatctgccgg catcgatccc 
gagatatgcg agacgcctat gatcgcatga tatttgcttt 
taaaaaacct gagcatgtgt agctcagatc cttaccgccg 
atatatcacc cgttactatc gtatttttat gaataatatt 
gtccgtcgac gagctcggcg cgccaagctt ggcgtaatca 
gtgaaattgt tatccgctca caattccaca- caacatacga 



gacatccact 
gcatgtagtc 
ttacacgatt 
cctgctttaa 
tgtgcacgtt 
cattctaatg 
atttactgat 
atttgttttt 
gtactaaatt 
gattaattga 
taaatatttg 
ggtttggaga 
attcttgagg 
aaaggtttag 
atggatgccc 
taaaaccatg 
actagttatg 
cactaagttt 
gggccatggc 
caattctgtt 
gtttcggttc 
ctccgttcaa 
tggtcatagc 
gccggaagca 



tggaggatgc 
tatataatga 
ataatttctt 
tgagatatgc 
gtaaaaaacc 
aatatatcac 
tgtccgtcga 
gttttactat 
tataacacct 
ttctaaatta 
ctaatatttc 
tttaattgtt 
ataataatgg 
taatttttca 
tgtggaaagt 
acatccactt 
catgtagtct 
tacacgatta 
ctgctttaat 
gtgcacgttg 
attctaatga 
tttactgatt 
tgtttcctgt 
taaagtgtaa 



120 
180 
240 
257 



60 
120 
180 
240 
300 
360 
420 
480 
540 
600 
660 
720 
780 
840 
900 
960 
1020 
1080 
1140 
1200 
1260 
1320 
1380 
1440 
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5 
10 
15 
20 



agcctggggt 
tttccagtcg 
' aggcggtttg 
cgttcggctg 
atcaggggat 
taaaaaggcc 
aaatcgacgc 
tccccctgga 
gtccgccttt 
cagttcggtg 



cgacGgctgc 



25 



30 



35 



40 



45 



SiO 



55 



60 



atcgccactg 
tacagagttc 
ctgcgctctg 
acaaaccacc 
aaaaggatct 
aaactcacgt 
tttaaattaa 
cagttaccaa 
catagttgcc 
ccccagtgct 
aaaccagcca 
ccagtctatt 
caaegttgtt 
attcagctcc 
agcggttagc 
actcatggtt 
ttctgtgact 
ttgctcttgc 
gctcatcatt 
atccagttcg 



gcctaatgag 
ggaaacctgt 
cgtattgggc 
cggcgagcgg 
aacgcaggaa 
gcgttgctgg 
tcaagrtcaga 
agctccctcg 
ctcccttcgg 
taggtcgttc 
gccttatccg 
gcagcagcca 
ttgaagtggt 
ctgaagccag 
gctggtagcg 
caagaagatc 
taagggattt 
aaatgaagtt 
tgcttaatca 
tgactccccg 
gcaatgatac 
gccggaaggg 
aattgttgcc 
gccattgcta 
ggttcccaac 
tccttcggtc 
atggcagcac 
ggtgagtact 
ccggcgtcaa 
ggaaaacgtt 
atgtaaccca 



tgagctaact 
cgtgccagct 
gctcttccgc 
tatcagctca 
agaacatgtg 
cgtttttcca 
srsrtggcgaaa 
tgcgctctcc 
gaagcgtggc 
gctccaagct 
gtaactatcg 
ctggtaacag 
ggcctaacta 
ttaccttcgg 
gtggtttttt 
ctttgatctt 
tggtcatgag 
ttaaatcaat 
gtgaggcacc 
tcgtgtagat 
cgcgagaccc 
ccgagqgcag 
gggaagctag 
caggcatcgt 
gatcaaggcg 
ctccgatcgt 
tgcataattc 
caaccaagtc 
tacgggataa 
Cttcggggcg 
ctcgtgcacc 



cacattaatt 
gcattaatga 
ttcctcgctc 
ctcaaaggcg 
agcaaaaggc 
taggctccgc 
cccgacagga 
tgttccgacc 
gctttctcat 
gggctgtgtg 
tcttgagtcc 
gattagcaga 
cggctacact 
aaaaagagtt 
tgtttgcaag 
ttctacgggg 
attatcaaaa 
ctaaagtata 
tatctcagcg 
aactacgata 
acgctcaccg 
aagtggtcct 
agtaagtagt 
QfSrtgtcacgc 
agttacatga 
tgtcagaagt 
tcttactgtc 
attctgagaa 
taccgcgcca 
aaaactctca 
caactgatct 



gcgttgcgct 
atcggccaac 
actgactcgc 
gtaatacggt 
cagcaaaagg 
ccccctgacg 
ctataaagat 
ctgccgctta 
agctcacgct 
cacgaacccc 
aacccggtaa 
gcgaggtatg 
agaaggacag 
ggtagctctt 
cagcagatta 
tctgacgctc 
aggatcttca 
tatgagtaaa 
atctgtctat 
cgggagggct 
gctccagatt 
gcaactttat 
tcgccagtta 
tcgtcgtttg 
tcccccatgt 
aagttggccg 
atgccatccg 
tagtgtatgc 
catagcagaa 
aggatcttac 
tcagcatctt 



cactgcccgc 
gcgcggggag 
tgcgctcggt 
tatccacaga 
ccaggaaccg 
agcatcacaa 
accaggcgtt 
ccggatacct 
gtaggtatct 
ccgttcagcc 
gacacgactt 
taggcggtgc 
tatttggtat 
gatccggcaa 
cgcgcagaaa 
agtggaacga 
cctagatcct 
cttggtctga 
ttcgttcatc 
taccatctgg 
tatcagcaat 
ccgcctccat 
atagtttgcg 
gtatggcttc 
tgtgcaaaaa 
cagtgttatc 
taagatgctt 
ggcgaccgag 
ctttaaaagt 
cgctgttgag 
ttactttcac 



1500 
1560 
1620 
1680 
1740 
1800 
1860 
1920 
1980 
2040 
2100 
2160 
2220 
2280 
2340 
2400 
2460 
2520 
2580 
2640 
2700 
2760 
2820 
2880 
2940 
3000 
3060 
3120 
3180 
3240 
3300 
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cagcgtttct 
gacacggaaa 
• gggttattgt 
ggttccgcgc 
gacattaacc 
tgacggtgaa 
ggatgccggg 
ctggcttaac 
aataccgcac 
gcgcaactgt 

r 

agggggatgt 

I 

ttgtaaaacg 
ccactaaacg 
atttgcgata 
ccaacactta 
acatatacta 
aagtgagtga 
ggcatataca 
aggtgcatga 
acacacaagt 
aatgatttgc 
aagaaaacta 
gcaatacttt 
agcccaccgc 
cgagacgcct 
ctgagcatgt 
cccgttacta 
agcaaattta 
tgi:gtgttat 
ttttatgcta 
atttttgtct 



gggtgagcaa 
tgttgaatac 
ctcatgagcg 
acatttcccc 
tataaaaata 
aacctctgac 
agcagacaag 
tatgcggcat 
agatgcgtaa 
tgggaagggc 
gctgcaaggc 
acggccagtg 
tctaaaccct 
aatttttata 
gcaatttgca 
atcaactgga 
atatggtacc 
ccaaacattc 
acgtcacgtg 
tttgaggtgc 
atggaagcca 
caaatttaca 
cattcataca 
Srsrtgggcggc 
atgatcgcat 
gtagctcaga 
tcgtattttt 
cacattgcca 
gtatttgatt 
acgtttgcca 
tctaaataca 



aaacaggaag 
tcatactctt 
gatacatatt 
gaaaagtgcc 
ggcgtatcac 
acatgcagct 
cccgtcaggg 
cagagcagat 
ggagaaaata 
gatcggtgcg 
gattaagttg 
aattcggcgc 
tgtaatttgt 
tttggtacta 
agttgattaa 
aatgtaaata 
acaaggtttg 
aataattctt 
gacaaaaggt 
atgcatggat 
tgtgtaaaac 
tgeaactagt 
cactcactaa 
cgcctgcagt 
gatatttgct 
tccttaccgc 
atgaataata 
ctaaacgtct 
tgcgataaat 
acacttagca 
tatactaatc 



gcaaaatgcc 
cctttttcaa 
tgaatgtatt 
acctgacgtc 
gaggcccttt 
cccggagacg 
cgcgtcagcg 
tgtactgaga 
ccgcatcagg 
ggcctcttcg 
ggtaacgcca 
gccgagctcc 
ttttgtttta 
aatttataac 
ttgattctaa 
tttgctaata 
gagatttaat 
gaggataata 
ttagtaattt 
gccctgtgga 
catgacatcc 
tatgcatgta 
gttttacacg 
ctagaaggcc 
ttcaattctg 
cggtttcggt 
ttctccgttc 
aaacccttgt 
ttttatattt 
atttgcaagt 
aactggaaat 



gcaaaaaagg 
tattattgaa 
tagaaaaata 
taagaaacca 
cgtctcgcgc 
gtcacagcfct 
ggtgttggcg 
gtgcaccata 
cgccattcgc 
ctattacgcc 
gggttttccc 
tcgagcaaat 
ctatgtgtgt 
accttttatg 
attatttttg 
tttctactat 
tgttgcaatg 
atggtaccac 
ttcaagacaa 
aagtttaaaa 
acttggagga 
gtctatataa 
attataattt 
tcctgcttta 
ttgtgcacgt 
tcattctaat 
aatttactga 
aatttgtttt 
ggtactaaat 
tgattaattg 
gtaaatattt 



gaataagggc 
gcatttatca 
aacaaatagg 
ttattatcat 
gtttcggtga 
gtctgtaagc 
ggtgtcgggg 
tgcggtgtga 
cattcaggct 
agctggcgaa 
agtcacgacg 
ttacacattg 
tatgtatttg 
ctaacgtttg 
tcttctaaat 
aggagaatta 
ctgcatggat 
acaagatttg 
caatgttacc 
atattttgga 
tgcaataatg 
tgaggatttt 
cttcatagcc 
atgagatatg 
tgtaaaaaac 
gaatatatca 
ttgtccgtcg 
tgttttacta 
ttataacacc 
attctaaatt 
gctaatattt 



3360 

3420 

3480 

3540 

3600 

3660 

3720 

3780 

3840 

3900 

3960 

4020 

4080 

4140 

4200 

4260 

4320 

4380 

4440 

4500 

4560 

4620 

4680 

4740 

4800 

4860 

4920 

4980 

5040 

5100 

5160 
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ctactatagg agaattaaag tgagtgaata tggtaccaca aggtttggag atttaattgt 5220 
tgcaatgctg catggatggc atatacacca aacattcaat aattcttgag gataataatg 5280 
' gtaccacaca agatttgagg tgcatgaacg tcacgtggac aaaaggttta gtaatttttc 5340 
aagacaacaa tgttaccaca cacaagtttt gaggtgcatg catggatgcc ctgtggaaag 5400 
tttaaaaata 

5410 

<210> 27 
<211> 12093 
<212> DNA 

<213> artificial sequence 



<400> 27 

gatctggcgc cggccagcga gacgagcaag 



gcgcccagca caggtgcgca ggcaaattgc 
tagtgggcgg tgacgtcgtt cgagtgaacc 
ataatcaggc cgatgccgac agcgtcgagc 
atgttgggtt tcacgtctgg cctccggacc 
ttctttatca ctgataagtt ggtggacata 
tgacaaagtt gcagccgaat acagtgatcc 
gcgtagacgg tctgacgaca cgcaaactgg 
tttactggca cttcaggaac aagcgggcgc 
cggagaatca tacgcattcg gtgccgagag 
ggaatgcccg cagcttcagg caggcgctgc 
ccggcacgcg accgggcgca ccgcagatgg 
gcgaggcggg tttttcggcc ggggacgccg 
ctgttggggc cgtgcttgag gagcaggccg 
ccgttgaaca ggctccgctc tcgccgctgt 
ccggtccgga cgcagcgttc gagcagggac 
ggaggctcgt tgtcaggaac gttgaaggac 
tgccggagcg caacccactc actacagcag 
ccaccgcgtc agacgcccgt agcagcccgc 
ccaagcctca cggccgcgct cggcctctct 
gctcactgac tcgctgcgct cggtcgttcg 
ggcggtaata cggttatcca cagaatcagg 



attggccgcc 
accaacgcat 
agatcgcgca 
gcgacagtgc 
agcctccgct 
ttatgtttat 
gtgccgccct 
cggaacggtt 
tgctcgacgc 
ccgacgacga 
tcgcctaccg 
aaacggccga 
tcaatgcgct 
gcgacagcga 
tgcgggccgc 
tcgcggtgat 
cgagaaaggg 
agccatgtag 
tacgggcttt 
ggcggccttc 
gctgcggcga 
ggataacgca 



gcccgaaacg 
acagcgccag 
ggaggcccgg 
tcagaattac 
ggtccgattg 
cagtgataaa 
ggacctgttg 
gggggttcag 

actggccgaa 
ctggcgctca 
cgatggcgcg 
cgcgcagctt 
gatgacaatc 
tgccggcgag 
gatagacgcc 
tgtcgatgga 
tgacgattga 
acaacatccc 
ttcatgccct 
tggcgctctt 
gcggtatcag 
ggaaagaaca 



atccgacagc 
cagaatgcca 
cagcaccggc 
gatcaggggt 
aacgcgcgga 
gtgtcaagca 
aacgaggtcg 
cagccggcgc 
gccatgctgg 
tttctgatcg 
cgcatccatg 
cgcttcctct 
agctacttca 
cgcggcggca 
ttcgacgaag 
ttggcgaaaa 
tcaggaccgc 
ctcccccttt 
gccctagcgt 
ccgcttcctc 
ctcactcaaa 
tgtgagcaaa 



60 
120 
180 
240 
300 
360 
420 
480 
540 
600 
660 
720 
780 
840 
900 
960 
1020 
1080 
1140 
1200 
1260 
1320 
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aggccagcaa 
ccgcccccct 
aggactataa 
gacccttgccg 
ccgctgcata 
tcgcacgata 
ggcgtcagcc 
ctgtccctta 
. ctaccgccgg 
agggcagccc 
aggcggccfgc 
aaatcapggg 
tgggccgcct 
tcggtcratgc 
gcaaggtcat 
aacggccggg 
gacttcgcgg 
gacgctcacc 
cgcgccagaa 
cctcgcggaa 
cgactcaccc 
gagctggcca 
gatgtggaca 
tgacagatga 
gcacctattg 
ccgcccgttt 
aaaccttgtt 
tgccccccct 
tgcgcccctc 



ttgccgggat 
ttgacgtgcc 



aaggccagga 
gacgagcatc 
agrataccagg 
cttaccggat 
accctgcttc 
tacaggattt 
gggcaggata 
ttcgcacctg 
cgtaacagat 
acctatcaag 
ggccggcatg 
cgtcgtggac 

srggcggcctg 
cacgatcctc 
gatgggcgtg 
gggtgcgcgt 
agctggtgaa 

gggctggttg 

acgccgtcga 
aacttggccc 
ggcgcggcgt 
gcctcgcaaa 
agcctgggga 
ggggcgcgat 
acatttgagg 
ttcggccacc 
tttaaccagg 
tctcgaaccc 
ggccgcgaac 
cggggcagta 
gcaggtgctg 



56/111 

accgtaaaaa ggccgcgttg 
acaaaaatcg acgctcaagt 
cgtttccccc tggaagctcc 
acctgtccgc ctttctccct 
ggggtcatta tagcgatttt 
tgccaaaggg ttcgtgtaga 
ggtgaagtag gcccacccgc 
gcggtgctca acgggaatcc 
gagggcaagc ggatggctga 
gtgtactgcc ttccagacga 
agcctgtcgg cctacctgct 
tatgagcacg tccgcgagct 
ctgaaactct ggctcaccga 
gccctgctgg cgaagatcga 
gtccgcccga gggcagagcc 
gattgccaag cacgtcccca 
gtacatcacc gacgagcaag 
ccctcgccgc tgggctggcg 
agccgtgtgc gagacaccgc 
tcactgacag atgaggggcg 
tgacagatga ggggcaggct 
tcggcgaaaa cgcctgattt 
taagtgccct gcggtattga 
ccttgacact tgaggggcag 
ggctgtccac aggcagaaaa 
gctaacctgt cttttaacct 
gctgcgccct gtgcgcgtga 
tcccggcccg ctaacgcggg 
ggcctcaccc caaaaatggc 
acgggatggg cgatcagccc 
gcatcgacat tcagcgacca 
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ctggcgtttt 
cagaggtggc 
ctcgtgcgct 
tcgggaagcg 
ttcggtatat 
ctttccttgg 
gagcgggtgt 
tgctctgcga 
tgaaaccaag 
acgaagagcg 
ggccgtcggc 
ggcccgcatc 
cgacccgcgc 
agagaagcag 
atgacttttt 
tgcgctccat 
gcaagaccga 
gccgtctatg 
ggccgccggc 
gacgttgaca 
cgatttcggc 
tacgcgagtt 
cacttgaggg 
agtgctgaca 
tccagcattt 
gcttttaaac 
ccgcgcacgc 
cctcccatcc 
agcgctggca 
gagcgcgacg 
ggtgccgggc 



tccataggct 
gaaacccgac 
ctcctgttcc 
tggcgctttt 
ccatcctttt 
tgtatccaac 
tccttcttca 
ggctggccgg 
ccaaccagga 
attgaggaaa 
cagggctaca 
aatggcgacc 
acggcgcggt 
gacgagcttg 
tagccgctaa 
caagaagagc 
gcgcctttgc 
gccctgcaaa 
gttgtggata 
cttgaggggc 
cggcgacgtg 
tcccacagat 
gcgcgactac 
gatgaggggc 
gcaagggttt 
caatatttat 
cgaagggggg 
ccccaggggc 
gtccttgcca 
cccggaagca 
agtgagggcg 



1380 

1440 

1500 

1560 

1620 

1680 

1740 

1800 

1860 
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2040 

2100 

2160 

2220 

2280 

2340 

2400 

2460 

2520 

2580 

2640 

2700 

2760 

2820 

2880 

2940 

3000 

3060 

3120 

3180 
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gcggcctggg tggcggcctg 
cggggccggc aatttttacc 
tgttcggggg tgcgataaac 
gtatgaaaac gagaattgga 
ctaccaagac gaagaggatg 
tactgat.aag ataatatatc 
ggcaaggcat aggcagcgcg 
tgcatggact aatgcttgaa 
attgggtaat gactccaact 
tgtcatgcag ctccaccgat 
gctgcctcag attcaggtta 
gcagct^ttcc cttcaggcgg 
cgtcaaaggg tgacagcagg 
atacgjtgcgc aacaaccgtc 
gcgatttagc cccgacatag 
tgcccggctg tatgcgcgag 
cgtgttgagg ccaacgccca 
catatcaatg attttctggt 
ccatgtttta cggcagtgag 
acgcaccacc ccgtcagtag 
agcacctcaa aaacaccatc 
tggtttcaaa atcggctccg 
aaaagctgtt ttctggtatt 
cttgttataa ttagcttctt 
taaatggcta aaatgagaat 
gtaaaagata cggaaggaat 
aacctatatt taaaaatgac 
gaaaaggaca tgatgctatg 
gaacggcatg atggctggag 
gaagagtatg aagatgaaca 
aggctctttc actccatcga 



57/111 

cccttcactt cggccgtcgg 
ttgggcattc ttggcatagt 
ccagcgaacc atttgaggtg 
cctttacaga attactctat 
aagaggatga ggaggcagat 
ttttatatag aagatatcgc 
cttatcaata tatctataga 
acccaggaca ataaccttat 
tattgatagt gttttatgtt 
tttgagaacg acagcgactt 
tgccgctca^ ttcgctgcgt 
gattcataca gcggccagcc 
ctcataagac gccccagcgt 
ttccggagac tgtcatacgc 
ccccactgtt cgtccatttc 
gttaccgact gcggcctgag 
taatgcgggc tgttgcccgg 
gcgtaccggg ttgagaagcg 
agcagagata gcgctgatgt 
ctgaacagga gggacagctg 
atacactaaa tcagtaagtt 
tcgatactat gttatacgcc 
taaggtttta gaatgcaagg 
ggggtatctt taaatactgt 
atcaccggaa ttgaaaaaac 
gtctcctgct aaggtatata 
ggacagccgg tataaaggga 
gctggaagga aagctgcctg 
caatctgctc atgagtgagg 
aagccctgaa aagattatcg 
catatcggat tgtccctata 
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ggcattcacg 
ggtcgcgggt 
ataggtaaga 
gaagcgccat 
tgccttgaat 
cgtatgtaag 
atgggcaaag 
agcttgtaaa 
cagataatgc 
ccgtcccagc 
atatcgcttg 
atccgtcatc 
cgccatagtg 
gtaaaacagc 
cgcgcagacg 
ttttttaagt 
c^tccaacgc 
gtgtaagtga 
ccggcggtgc 
atagacacag 
ggcagcatca 
aactttgaaa 
aacagtgaat 
agaaaagagg 
tgatcgaaaa 
agctggtggg 
ccacctatga 
ttccaaaggt 
ccgatggcgt 
agctgtatgc 
cgaatagctt 



gacttcatgg 
gccgtgctcg 
ttataccgag 
atttaaaaag 
atattgacaa 
gatttcaggg 
cataaaaact 
ttctatcata 
ccgatgactt 
cgtgccaggt 
ctgattacgt 
catatcacca 
cgttcaccga 
cagcgctggc 
atgacgtcac 
gacgtaaaat 
cattcatggc 
actgcagttg 
ttttgccgtt 
aagccactgg 
cccataattg 
acaactttga 
tggagttcgt 
aaggaaataa 
ataccgctgc 
agaaaatgaa 
tgtggaacgg 
cctgcacttt 
cctttgctcg 
ggagtgcatc 
agacagccgc 



3240 
3300 
3360 
3420 
3480 
3540 
3600 
3660 
3720 
3780 
3840 
3900 
3960 
4020 
4080 
4140 
4200 
4260 
4320 
4380 
4440 
4500 
4560 
4620 
4680 
4740 
4800 
4860 
4920 
4980 
5040 
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ttagccgaat tggattactt actgaataac gatctggccg atgtggattg cgaaaactgg 5100 

gaagaagaca ctccatttaa agatccgcgc gagetgtatg attttttaaa gacggaaaag 5160 

cccgaagagg aacttgtett ttcccacggc gacctgggag acagcaacat etttgtgaaa 5220 

gatggeaaag taagtggott tattgatctt gggagaagcg gcagggcgga caagtggtat 5280 

gacattgcct tctgcgtccg gtcgatcagg gaggatatog gggaagaaca gtatgtcgag 5340 

• ctattttttg acttactggg gatcaa&cct gattgggaga aaataaaata ttatatttta 5400 

ctggatgaat tgttttagta cctagatgtg gcgcaacgat gccggcgaca agcaggagcg 5460 

caccgacttc ttccgcatca agtgttttgg ctctcaggcc gaggcccaog gcaagtattt 5520 

gggbaagggg tcgctggtat tcgtgcaggg caagattcgg aataccaagt acgagaagga 5580 

cggccagacg gtctacggga ccgacttcat tgccgataag gtggattatc tggacaccaa 5640 

ggcaccarfgo gggtcaaatc aggaataagg gcacattgcc ccggcgtgag tcggggcaat 5700 

cccgcapgga gggtgaatga atcggacgtt tgaccggaag gcatacaggc aagaactgat 5760 

cgacgcgggg ttttccgecg aggatgccga aaocatogca agccgcaccg tcatgcgtgc 5820 

gccccgcgaa accttccagt ccgtcggctc gatggtccag caagctacgg ccaagatcga 5880 

gogcgacagc gtgcaactgg ctccccctgc cctgcccgcg ccatcggccg ccgtggagcg 5940 

ttcgcgtcgt ctcgaacagg aggcggoagg tttggcgaag tcgatgacca tcgacacgcg 6000 

aggaactatg acgaccaaga agcgaaaaac cgccggcgag gacctggcaa aacaggtcag 6060 

cgaggccaag caggccgcgt tgctgaaaca cacgaagcag cagatcaagg aaatgcagct 6120 

ttccttgttc gatattgcgc cgtggccgga cacgatgcga gcgatgccaa acgacacggc " 6180 

ccgctctgcc ctgttcacca cgcgcaaoaa gaaaatcccg cgcgaggcgc tgcaaaacaa 6240 

ggtoattttc cacgtcaaca aggacgtgaa gatcacctac accggcgtcg agctgcgggc 6300 

cgacgatgac gaactggtgt ggcagcaggt gttggagtac gcgaagcgca cccctatcgg 6360 

cgagccgatc accttcacgt tctacgagct ttgccaggac ctgggctggt cgatcaatgg 6420 

ccggtattac acgaaggccg aggaatgcct gtcgcgccta caggcgacgg cgatgggctt 6480 

cacgtccgac cgcgttgggc acctggaatc ggtgtcgctg ctgcaccgot tccgcgtcct 6540 

ggaccgtggc aagaaaacgt cccgttgcca ggtcctgatc gacgaggaaa tcgtcgtgct 6600 

gtttgctggc gaccactaca cgaaattcat atgggagaag taccgcaagc tgtcgccgac 6660 

ggcccgacgg atgttcgact atttcagctc gcaccgggag ccgtacccgc tcaagctgga 6720 

aaccttcogc ctcatgtgcg gatcggattc cacccgogtg aagaagtggc gcgagcaggt 6780 

cggcgaagcc tgcgaagagt tgcgaggcag cggcctggtg gaacacgcct gggtcaatga 6840 

tgacctggtg cattgcaaac gctagggcct tgtggggtca gttccggctg ggggttcagc 6900 
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10 

15 

20 

25 

30 

35 

40 

45 

50 

55 

60 



agccagcgct 
tcagtatcgc 
ttgacaattg 
cgcga^atcc 
cacgaggaga 
ggcgcct.aca 
aaggacgctc 
ggggtcgccg 
cgacagattc 
tcgctattct 
acggtag^cg 
ccgat^cgat 
gtgttgacac 
gtttccatgg 
acctttaccg 
tttgatccgc 
ctgatcggag 
acagttgttt 
catcaggccg 
aggggagttg 
cggctttatc 
cggttaagcg 
tttgatcaca 
tcatccgtgt 
gagcaaagtc 
gcctgtatcg 
tggcaggata 
gacgttttta 



tgcccttcac 
gcaggcgaaa 
agaatagccc 



ttactggcat 
tcgggacgca 
tgattaaggc 
gattgtcggc 
aaaagcccat 
tcgacggcga 
acaaggcgca 
gtatgctgct 
caacggigaat 
ggagcttgtt 
ctgtgcagcc 
tgatggcggt 
caaacgcagc 
cgttcggaac 
cctggcaact 
caatcccgat 
cgggtttaac 
ccttactggg 
acagtcggaa 
atatcgtcaa 
cagcgatttc 
agaaatgaat 
ggcagcaacg 
ttcaaacccg 
tgccgcctta 
agtgcrtgatt 
tattgtggtg 
atgtactggg 
cgcctggccc 
atcctgtttg 
gagatagggt 
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ttcaggaaca agcgggcact 
cggcgcgctc tacgaactgc 
tcagattcga cggcttggag 
cctgaagaaa gctccagaga 
ggaggcgttc gctgaacggt 
gatcattggg ctgtcggtct 
tctgtccggc gttttcgtgg 
gcgggcgttg ccggcgggtt 
ctggtggatg cgcatcttca 
gtttatttcg gtctaccgcc 
gctgatggtc gtgttcatct 
cctgggggct atttgcggaa 
gctagatcct gtcggcgtcg 
cgtgctgacc cgcaagtggc 
ggcggccgga ggacttctgc 
gcctacagga accaatgttc 
ctacttcctt tggttccggg 
ctttctcagc cccagatctg 
cttcgggtcc ccgacctgta 
cgttcacttc taaagaaata 
ctattatgtc ggcatagttc 
aagaaggctg ataattcgga 
ctctgtcatc gttacaatca 
gcagcttagt tgccgttctt 
caacggctct cccgctgacg 
ttgtgccgag ctgccggtcg 
taaacaaatt gacgcttaga 
gtggtttttc ttttcaccag 
tgagagagtt gcagcaagcg 
atggtggttc cgaaatcggc 
tgagtgttgt tccagtttgg 
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gctcgacgca 
cgataaacag 
cggccgacgt 
tgttcgggtc 
tgcgagatgc 
tcaaacagga 
agcccgaaca 
tattgctcgt 
tcctcggcgc 
tgccgggcgg 
ctgccgctct 
ctgcgggcgt 
cagcgggcct 
aacctcccgt 
tcgttccagt 
tcggcctggc 
ggatctcgcg 
gggtcgatca 
ccattcggtg 
gcgccactca 
tcaagatcga 
tctctgcgag 
acatgctacc 
ccgaatagca 
ccgtcccgga 

gggagctgtt 

caacttaata 
tgagacgggc 
gtccacgctg 
aaaatccctt 
aacaagagtc 



cttgcttcgc 
aggattaaaa 
gcaggatttc 
cgtttacgag 
cgtggcattc 
ggacggcccc 
gcgaggccga 
gatgatcgtc 
acttaatatt 
ggtcgcggcg 
gctaggtagc 
ggcgctgttg 
ggcgggggcg 
gcctctgctc 
agctttagtg 
gtggctcggc 
actcgaacct 
gccggggatg 
agcaatggat * 
gcttcctcag 
cagcctgtca 
ggagatgata 
ctccgcgaga 
tcggtaacat 
ctgatgggct 
ggctggctgg 
acacattgcg 
aacagctgat 
gtttgcccca 
ataaatcaaa 
cactattaaa 



6960 

7020 

7080 

7140 

7200 

7260 

7320 

7380 

7440 

7500 

7560 

7620 

7680 

7740 

7800 

7860 

7920 

7980 

8040 

8100 

8160 

8220 

8280 

8340 

8400 

8460 

8520 

8580 

8640 

8700 

8760 
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• gaacgtggac tccaacgtca aagggcgaaa aaccgtctat cagggcgatg gcccactacg 8820 
tgaaccatca cccaaatcaa gttttttggg gtcgaggtgc cgtaaagcac taaatcggaa 8880 
6 coctaaaggg agcccccgat ttagagcttg acggggaaag ccggcgaacg tggcgagaaa 8940 
-if. ggaagggaag aaagcgaaag gagcgggcgc cattcaggct gcgcaactgt tgggaagggc 9000 
gatcggtgcg ggcctcttcg ctattacgcc agctggcgaa agggggatgt gctgoaaggc 9060 
gattaagttg ggtaacgcca gggttttccc agtcacgacg ttgtaaaacg acggccagtg 9120 
aattaattcc catcttgaaa gaaatatagt ttaaatattt attgataaaa taacaagtca giso 
15 ggtattatag tccaagcaaa aacataaatt fcattgatgca agtttaaatt cagaaatatt 9240 
tcaataactg attatatcag ctggtacatt gccgtagatg aaagactgag tgcgatatta 9300 
tgtgtaatac ataaattgat gatatagcta gcttagctca tcgggggatc cgtcgaagct 9360 
agcttggjjtc ccgctcagaa gaactcgtca agaaggcgat agaaggcgat gcgctgcgaa 9420 
tcgggaigcgg cgataccgta aagcacgagg aagcggtcag cccattcgcc gccaagctct 9480 
tcagcaatat cacgggtagc caacgctatg tcctgatagc ggtccgccac acccagccgg 9540 
ccaoa^tcga tgaatccaga aaagcggcca ttttccacca tgatattcgg caagcaggca 9600 
tcgccatggg tcacgacgag atcctcgccg tcgggcatgc gcgccttgag cctggcgaac 9660 
agttcggctg gcgcgagccc ctgatgctct tcgtccagat catcctgatc gacaagaccg 9720 
gcttccatcc gagtacgtgc tcgctcgatg cgatgtttcg cttggtggtc gaatgggcag 9780 
gtagccggat caagcgtatg cagecgccgc attgcatcag ccatgatgga tactttctcg 9840 
gcaggagcaa ggtgagatga oaggagatcc tgccccggca cttcgcccaa tagcagccag " 9900 
tcccttcccg cttcagtgac aacgtcgagc acagctgcgc aaggaacgcc cgtcgtggco 9960 
agccacgata gccgcgctgc ctcgtcctgc agttcattca gggcaccgga caggtcggtc 10020 
ttgacaaaaa gaaccgggcg cccctgcgct gacagccgga acacggcggc atcagagcag 10080 
ccgattgtct gttgtgccca gtcatagccg aatagcctct ccacccaagc ggccggagaa 10140 
cctgcgtgca atccatcttg ttcaatccaa gctccoatgg gccctcgact agagtcgaga 10200 
tctggattga gagtgaatat gagactctaa ttggatacog aggggaattt atggaacgtc 10260 
agtggagcat ttttgacaag aaatatttgc tagctgatag tgaccttagg cgacttttga 10320 
acgcgcaata atggtttc.tg acgtatgtgc ttagctcatt aaactccaga aacccgcggc 10380 
tgagtggctc cttcaacgtt gcggttctgt cagttccaaa cgtaaaacgg cttgtcccgc • 10440 
gtcatcggcg ggggtcataa cgtgactccc ttaattctcc gctcatgatc ttgatcccct 10500 
gcgccatcag atbcttggcg gcaagaaagc catccagttt actttgcagg gottcccaac 10560 
cttaccagag ggcgccccag otggcaattc cggttcgott gctgtccata aaaccgccca 10620 
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gtctagctat cgccatgtaa gcccactgca agctacctgc tttctctttg cgcttgcgtt 10680 
ttcccttgtc cagatagccc agtagctgao attcatccgg ggtcagcaco gtttctgcgg 10740 
5 actggctttc tacgtgttcc sKrttccttta gcagcccttg cgocctgagt gcttgcggca 10800 
'^aA gcgtsl&agct tgcatgcctg caggtcgacg gcgcgccgag ctcctcgagc aaatttacac 10860 
attgccacta aacgtctaaa cccttgtaat ttgtttttgt tttactatgt gtgttatgta 10920 
tttgatttgc gataaatttt tatatttggt actaaattta taacaccttt tatgctaacg 10980 
tttgccaaca cttagcaatt tgcaagttga ttaattgatt ctaaattatt tttgtcttct 11040 
15 aaatacatat actaatcaac tggaaatgta aatatttgct aatatttcta ctataggaga 11100 
attaaagtga gtgaatatgg taccacaagg tttggagatt taattgttgc aatgctgcat 11160 
^ ggatggcata tacaccaaae attcaataat tcttgaggat aataatggta ccacacaaga 11220 
tttgaggtgc atgaacgtca cgtggacaaa aggtttagta atttttcaag acaacaatgt 11280 
tacca^acac aagttttgag gtgcatgcat ggatgccctg tggaaagttt aaaaatattt 11340 
25 tggaaatgat ttgcatggaa gccatgtgta aaaccatgac atccacttgg aggatgcaat 11400 
aatg^agaaa actacaaatt tacatgcaac tagttatgca tgtagtctat ataatgagga 11460 
^ ttttgcaata ctttcattca tacacactca ctaagtttta cacgattata atttcttcat 11520 
agccagccca ccgcggtggg cggccgcctg cagtotagaa ggcctcctgc tttaatgaga 11580 
tatgcgagao gcctatgatc gcatgatatt tgctttcaat tctgttgtgc acgttgtaaa 11640 
35 aaacctgagc atgtgtagct cagatcctta ccgccggttt cggttcattc taatgaatat 11700 
atcacccgtt actatcgtat ttttatgaat aatattotcc gttcaattta ctgattgtcc ' 11760 
^ gtcgacgaat tcgagctcgg cgcgcctcta gaggatcgat gaattcagat cggctgagtg 11820 
gctcettcaa cgttgcggtt ctgtcagttc eaaacgtaaa acggcttgtc ccgcgtcatc 11880 
ggcgggggtc ataacgtgac tcccttaatt ctccgctcat gatcagattg tcgtttcccg 11940 
45 ccttcagttt aaactatcag tgtttgacag gatatattgg cgggtaaaoc taagagaaaa 12000 
gagcgtttat tagaataatc ggatatttaa aagggcgtga aaaggtttat ccttcgtcca 12060 
tttgtatgtg catgccaacc acagggttcc cca 12093 

<210> 28 

<211> 12085 

<212> DNA 

55 <213> artificial sequence 

<220> 

<22r> misc^featxire 

60 ^"^^ «s!SStossJt??''^^^^°'^''^''*'°'' "^'^ ^^^^^ Promotor-Terminator-E^r 
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<400> 28 
gatctggcgc 



gcgcccagca 
' tagtgggcgg 
ataatcaggc 
atgttgggtt 
ttctttatca 
tgacaaagtt 
gcgtagacgg 
tttactggca 
cggagaatca 

r 

ggaatgcccg 

I 

ccggcacgcg 
gcgaggcggg 
ctgttggggc 
ccgttgaaca 
ccggtccgga 
ggaggctcgt 
tgccggagcg 
ccaccgcgtc 
ccaagcctca 
gctcactgac 
ggcggtaata 
aggccagcaa 
ccgcccccct 
aggactataa 
gaccctgccg 
ccgctgcata 
tcgcacgata 
ggcgtcagcc 
ctgtccctta 
ctaccgccgg 



cggccagcga 
caggtgcgca 
tgacgtcgtt 
cgatgccgac 
tcacgtctgg 
ctgataagtt 
gcagccgaat 
tctgacgaca 
cttcaggaac 
tacgcattcg 
cagcttcagg 
accgggcgca 
tttttcggcc 
cgtgcttgag 
ggctccgctc 
cgcagcgttc 
tgtcaggaac 
caacccactc 
agacgcccgt 
cggccgcgct 
tcgctgcgct 
cggttatcca 
aaggccagga 
gacgagcatc 
agataccagg 
cttaccggat 
accctgcttc 
tacaggattt 
gggcaggata 
ttcgcacctg 
cgtaacagat 



gacgagcaag 
ggcaaattgc 
cgagtgaacc 
agcgtcgagc 
cctccggacc 
ggtggacata 
acagtgatcc 
cgcaaactgg 
aagcgggcgc 
gtgccgagag 
caggcgctgc 
ccgcagatgg 

ggggacgccg 

gagcaggccg 
tcgccgctgt 
gagcagggac 
gttgaaggac 
actacagcag 
agcagcccgc 
cggcctctct 
cggtcgttcg 
cagciatcagg 
accgtaaaaa 
acaaaaatcg 
cgtttccccc 
acctgtccgc 
ggggtcatta 

tgccaaaggg 
ggtgaagtag 
gcggtgctca 
gagggcaagc 



attggccgcc 
accaacgcat 
agatcgcgca 
gcgacagtgc 
agcctccgct 
ttatgtttat 
gtgccgccct 
cggaacggtt 
tgctcgacgc 
ccgacgacga 
tcgcctaccg 
aaacggccga 
tcaatgcgct 
gcgacagcga 
tgcgggccgc 
tcgcggtgat 
cgagaaaggg 
agccatgtag 
tacgggcttt 
ggcggccttc 
gctgcggcga 
ggataacgca 
ggccgpgttg 
acgctcaagt 
tggaagctcc 
ctttctccct 
tagcgatttt 
ttcgtgtaga 
gcccacccgc 
acgggaatcc 
ggatggctga 



gcccgaaacg 
acagcgccag 
ggaggcccgg 
tcagaattac 
ggtccgattg 
cagtgataaa 
ggacctgttg 

gggggttcag 

actggccgaa 
ctggcgctca 
cgatggcgcg 
cgcgcagctt 
gatgacaatc 
tgccggcgag 
gatagacgcc 
tgtcgatgga 
tgacgattga 
acaacatccc 
ttcatgccct 
tggcgctctt 
gcggtatcag 
ggaaagaaca 
ctggcgtttt 
cagaggtggc 
ctcgtgcgct 
tcgggaagcg 
ttcggtatat 
ctttccttgg 
gagcgggtgt 
tgctctgcga 
tgaaaccaag 



atccgacagc 
cagaatgcca 
cagcaccggc 
gatcaggggt 
aacgcgcgga 
gtgtcaagca 
aacgaggtcg 
cagccggcgc 
gccatgctgg 
tttctgatcg 
cgcatccatg 
cgcttcctct 
agctacttca 
cgcggcggca 
ttcgacgaag 
ttggcgaaaa 
tcaggaccgc 
ctcccccttt 
gccctagcgt 
ccgcttcctc 
ctcactcaaa 
tgtgagcaaa 
tccataggct 
gaaacccgac 
ctcctgttcc 
tggcgctttt 
ccatcctttt 
tgtatccaac 
tccttcttca 
ggctggccgg 
ccaaccagga 



60 
120 
180 
240 
300 
360 
420 
480 
540 
600 
660 
720 
780 
840 
900 
960 
1020 
1080 
1140 
1200 

1260 

1320 

1380 

1440 

1500 

1560 

1620 

1680 

1740 

1800 

1860 
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agggcagccc 
aggcggcggc 
' aaatcacggg 
tgggccgcct 
tcggtgatgc 
gcaaggtcat 
aacggccggg 
gacttcgcgg 
gacgctcacc 
cgcgccagaa 

cctcgcggaa 

t 

cgactcaccc 
gagctggcca 
gatgtggaca 
tgacagatga 
gcacctattg 
ccgcccgrttt 
aaaccttgtt 
tgcccccpct 
tgcgcccctc 
ttgccgggat 
ttgacgtgcc 
gcggcctggg 
cggggccggc 
tgttcggggg 
gtatgaaaac 
ctaccaagac 
tactgataag 
ggca^ggcat 
tgcatggact 
attgggtaat 



acctatcaag 
ggccggcatg 
cgtcgtggac 
gggcggcctg 
cacgatcctc 
gatgggcgtg 
gggtgcgcgt 
agctggtgaa 
gggctggttg 
acgccgtcga 
aacttggccc 
ggcgcggcgt 
gcctcgcaaa 
agcctgggga 
ggggcgcgat 
acatttgagg 
ttcggccacc 
tttaaccagg 
tctcgaaccc 
ggccgcgaac 
cggggcagta 
gcaggtgctg 
tggcggcctg 
aatttttacc 
tgcgataaac 
gagaattgga 
gaagaggatg 
ataatatatc 
aggcagcgcg 
aatgcttgaa 
gactccaact 



gtgtactgcc 
agcctgtcgg 
tatgagcacg 
ctgaaactct 
gccctgctgg 
gtccgcccga 
gattgccaag 
gtacatcacc 
ccctcgccgc 
agccgtgtgc 
tcactgacag 
tgacagatga 
tcggcgaaaa 
taagtgccct 
ccttgacact 
ggctgtccac 
gctaacctgt 
gctgcgccct 
tcccggcccg 
ggcctcaccc 
acgggatggg 
gcatcgacat 
cccttcactt 
ttgggcattc 
Gcagcgaacc 
cctttacaga 
aagaggatga 
ttttatatag 
cttatcaata 
acccaggaca 
tattgatagt 



ttccagacga 
cctacctgct 
tccgcgagct 
ggctcaccga 
cgaagatcga 
gggcagagcc 
cacgtcccca 
gacgagcaag 
tgggctggcg 
gagacaccgc 
atgaggggcg 
ggggcaggct 
cgcctgattt 
gcggtattga 
tgaggggcag 
aggcagaaaa 
cttttaacct 
gtgcgcgtga 
Gtaacgcggg 
caaaaatggc 
cgatcagccc 
tcagcgacca 
cggcQgtcgg 
ttggcatagt 
atttgaggtg 
at tact c tat 
ggaggcagat 
aagatatcgc 
tatctataga 
ataaccttat 
gttttatgtt 



acgaagagcg 
ggccgtcggc 
ggcccgcatc 
cgacccgcgc 
agagaagcag 
atgacttttt 
tgcgctccat 
gcaagaccga 
gccgtctatg 
ggccgccggc 
gacgttgaca 
cgatttcggc 
tacgcgagtt 
cacttgaggg 
agtgctgaca 
tccagcattt 
gcttttaaac 
Gcgcgcacgc 
cctcccatcc 
agcgctggca 
gagcgcgacg 
ggtgccgggc 
ggcattcacg 
ggtcgcgggt 
ataggtaaga 
gaagcgccat 
tgccttgaat 
cgtatgtaag 
atgggcaaag 
agcttgtaaa 
cagataatgc 



attgaggaaa 
cagggctaca 
aatggcgacc 
acggcgcggt 
gacgagcttg 
tagccgctaa 
caagaagagc 
gcgcctttgc 
gccctgcaaa 
gttgtggata 
cttgaggggc 
cggcgacgtg 
tcccacagat 
gcgcgactac 
gatgaggggc 
gcaagggttt 
caatatttat 
cgaagggggg 
ccccaggggc 
gtccttgcca 
cccggaagca 
agtgagggcg 
gacttcatgg 
gccgtgctcg 
ttataccgag 
atttaaaaag 
atattgacaa 
gatttcaggg 
cataaaaact 
ttctatcata 
ccgatgactt 



1920 

1980 

2.040 

2100 

2160 

2220 

2280 

2340 

2400 

2460 

2520 

2580 

2640 

2700 

2760 

2820 

2880 

2940 

3000 

3060 

3120 

3180 

3240 

3300 

3360 

3420 

3480 

3540 

3600 

3660 

3720 
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tgtcatgcag 
gctgcctcag 
' gcagctttcc 
cgtcaaaggg 
atacgtgcgc 
gcgatttagc 
tgcccggctg 
cgtgttgagg 
catatcaatg 



ccatgtttta 

r 

acgcaccacc 
f 

agcacctcaa 
tggtttcaaa 

4 

aaaagctgtt 
cttgttataa 
taaatggcta 
gtaaaagata 
aacctatatt 
gaaaaggaca 
gaacggcatg 
gaagagtatg 
aggctctttc 
ttagccgaat 
gaagaagaca 
cccgaagagg 
gatggcaaag 
gacattgcct 
ctattttttg 
ctggatgaat 
caccgacttc 
gggcaagggg 



ctccaccgat 
attcaggtta 
cttcaggcgg 
tgacagcagg 
aacaaccgtc 
cccgacatag 
tatgcgcgag 
ccaacgccca 
attttctggt 
cggcagtgag 
ccgtcagtag 
aaacaccatc 
atcggctccg 
ttctggtatt 
ttagcttctt 
aaatgagaat 
cggaaggaat 
taaaaatgac 
tgatgctatg 
atggctggag 
aagatgaaca 
actccatcga 
tggattactt 
ctccatttaa 
aacttgtctt 
taagtggctt 
tctgcgtccg 
acttactggg 
tgttttagta 
ttccgcatca 
tcgctggtat 



tttgagaacg 
tgccgctcaa 
gattcataca 
ctcataagac 
ttccggagac 
ccccactgtt 
gttaccgact 
taatgcgggc 
gcgtaccggg 
agcagagata 
ctgaacagga 
atacactaaa 
tcgatactat 
taaggtttta 
ggggtatctt 
atcaccggaa 
gtctcctgct 
ggacagccgg 
gctggaagga 
caatctgctc 
aagccctgaa 
catatcggat 
actgaataac 
agatccgcgc 
ttcccacggc 
tattgatctt 
gtcgatcagg 
gatcaagcct 
cctagatgtg 
agtgttttgg 
tcgtgcaggg 



acagcgactt 
ttcgctgcgt 
gcggccagcc 
gccccagcgt 
tgtcatacgc 
cgtccatttc 
gcggcctgag 
tgttgcccgg 
ttgagaagcg 
gcgctgatgt 
gggacagctg 
tcagtaagtt 
gttatacgcc 
gaatgcaagg 
taaatactgt 
ttgaaaaaac 
aaggtatata 
tataaaggga 
aagctgcctg 
atgagtgagg 
aagattatcg 
tgtccctata 
gatctggccg 
gagctgtatg 
gacctgggag 
gggagaagcg 
gaggatatcg 
gattgggaga 
gcgcaacgat 
ctctcaggcc 
caagattcgg 



ccgtcccagc 
atatcgcttg 
atccgtcatc 
cgccatagtg 
gtaaaacagc 
cgcgcagacg 
ttttttaagt 
catccaacgc 
gtgtaagtga 
ccggcggtgc 
atagacacag 
ggcagcatca 
aactttgaaa 
aacagtgaat 
agaaaagagg 
tgatcgaaaa 
agctggtggg 
ccacctatga 
ttccaaaggt 
ccgatggcgt 
agctgtatgc 
cgaatagctt 
atgtggattg 
attttttaaa 
acagcaacat 
gcagggcgga 
gggaagaaca 
aaataaaata 
gccggcgaca 
gaggcccacg 
aataccaagt 



cgtgccaggt 
ctgattacgt 
catatcacca 
cgttcaccga 
cagcgctggc 
atgacgtcac 
gacgtaaaat 
cattcatggc 
actgcagttg 
ttttgccgtt 
aagccactgg 
cccataattg 
acaactttga 
tggagttcgt 
aaggaaataa 
ataccgctgc 
agaaaatgaa 
tgtggaacgg 
cctgcacttt 
cctttgctcg 
srgagtgcatc 
agacagccgc 
cgaaaactgg 
gacggaaaag 
ctttgtgaaa 
caagtggtat 
gtatgtcgag 
ttatatttta 
agcaggagcg 
gcaagtattt 
acgagaagga 



3780 

3840 

3900 

3960 

4020 

4080 

4140 

4200 

4260 

4320 

4380 

4440 

4500 

4560 

4620 

4680 

4740 

4800 

4860 

4920 

4980 

5040 

5100 

5160 

5220 

5280 

5340 

5400 

5460 

5520 

5580 
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oggocagacg gtctacggga ccgacttcat tgccgataag gtggattatc tggacaccaa 5640 
ggcaccaggc gggtcaaatc aggaataagg gcacattgcc ccggcgtgag tcggggcaat 5700 
^ • cccgcaagga gggtgaatga atcggacgtt tgaccggaag gcatacaggc aagaactgat 5760 
cgacgcgggg ttttccgccg aggatgcoga aaccatcgca agccgcaccg tcatgcgtgc 5820 
gccccgcgaa accttccagt ccgtcggctc gatggtccag caagbtacgg ccaagatcga 5880 
gcgogacagc gtgcaactgg ctccccctgc cctgcccgcg ccatcggccg ccgtggagcg 5940 
ttcgcgtcgt ctcgaacagg aggcggcagg tttggcgaag tcgatgacca tcgacacgcg 6000 
aggaactatg acgaccaaga agcgaaaaac cgccggcgag gacctggcaa aacaggtcag 6060 
cgaggccaag oaggccgcgt tgctgaaaca cacgaagcag cagatcaagg aaatgcagct 6120 

ttccttg^tc gatattgcgc cgtggccgga cacgatgcga gcgatgccaa acgacacggc 6180 

ccgctqtgcc ctgttcacca cgcgcaacaa gaaaatcccg cgcgaggcgc tgcaaaacaa 6240 

ggtcattttc cacgtcaaca aggacgtgaa gateacctac accggcgtcg agctgcgggc 6300 

cgacgatgac gaactggtgt ggcagcaggt gttggagtac gcgaagcgca cccctatcgg 6360 

cgagccgatc accttcacgt tctacgagct ttgccaggac ctgggctggt cgatcaatgg 6420 

ccggtattac acgaaggccg aggaatgcct gtcgcgccta caggcgacgg cgatgggctt 6480 

cacgtccgac cgcgttgggc acctggaatc ggtgtcgctg ctgcaccgct tccgcgtcct 6540 

ggaccgtggc aagaaaacgt cccgttgcca ggtcctgatc gacgaggaaa tcgtcgtgct 6600 

gtttgctggc gaccactaca cgaaattcat atgggagaag taccgcaagc tgtcgccgac 6660 

ggcccgacgg atgttcgact atttcagctc gcaccgggag ccgtacccgc tcaagctgga 6720 

aaccttocgc ctcatgtgcg gatcggattc cacccgegtg aagaagtggc gcgagcaggt 6780 

cggcgaagcc tgcgaagagt tgcgaggcag cggcctggtg gaacacgcct gggtcaatga 6840 

tgacctggtg cattgcaaac gctagggcct tgtggggtca gttccggctg ggggttcagc 6900 

agccagcgct ttactggcat ttoaggaaca agcgggcact gctcgaogca cttgcttcgc 6960 

tcagtatcgc togggacgca cggcgcgcto tacgaactgc cgataaacag aggattaaaa 7020 

ttgacaattg tgattaaggc tcagattcga cggcttggag cggccgacgt gcaggatttc 7080 

cgcgagatcc gattgtcggc cctgaagaaa gctccagaga tgttcgggtc cgtttacgag 7140 

cacgaggaga aaaagcccat ggaggcgttc gctgaacggt tgcgagatgo cgtggcattc 7200 

ggcgcctaca tcgacggcga gatcattggg ctgtcggtct tcaaacagga ggacggcccc 7260 

aaggk'cgctc acaaggcgca tctgtccggc gttttcgtgg agcccgaaca gcgaggccga 7320 

ggggtcgccg gtatgctgct gcgggcgttg ccggcgggtt tattgctcgt gatgatcgtc 7380 

cgacagattc caacgggaat ctggtggatg cgcatcttca tcctcggcgc acttaafcatt 7440 
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fcgctattct ggagcttgtt gtttatttcg gtctaccgcc tgccgggcgg ggtcgcggcg 7500 

aoggtaggcg ctgtgcagcc gctgatggtc gtgttcatct ctgccgctct gctaggtagc 7560 

'ccgatacgat tgatggcggt cctgggggct atttgcggaa ctgcgggcgt ggcgctgttg 7620 

gtgttgacac caaacgcagc gctagatcct gtcggcgtcg cagcgggcct ggcgggggcg 7680 

gtttccatgg cgttcggaac cgtgctgacc cgcaagtggc aacotcccgt gcctctgctc 7740 

acctttaccg cctggcaact ggcggccgga ggacttctgc tcgttccagt agctttagtg 7800 

tttgatcegc caatcccgat gcctacagga accaatgttc tcggcctggc gtggctcggc 7860 

ctgatcggag cgggtttaac ctacttcctt tggttccggg ggatetcgcg actcgaacct 7920 

acagttgttt ccttactggg ctttctcagc cccagatctg gggtcgatca gccggggatg 7980 

catcaggc^cg acagtcggaa cttcgggtcc ccgacctgta ccattcggtg agcaatggat 8040 

aggggagttg atatcgtcaa cgttcacttc taaagaaata gcgccactca gcttcctcag 8100 

cggctttatc cagcgatttc ctattatgtc ggcatagttc tcaagatcga cagcctgtca 8160 

cggttaagcg agaaatgaat aagaaggctg ataattcgga tctctgcgag ggagatgata 8220 

tttgatcaca ggcagcaacg ctctgtcatc gttacaatca acatgctacc ctccgcgaga 8280 

tcatccgtgt ttcaaacccg gcagcttagt tgccgttctt ccgaatagca tcggtaacat 8340 

gagcaaagtc tgcogcctta caacggctct cccgctgacg ccgtcccgga ctgatgggct 8400 

gcctgtatcg agtggtgatt ttgtgccgag ctgccggtcg gggagctgtt ggctggctgg 8460 

tggcaggata tattgtggtg taaacaaatt gacgcttaga caacttaata acacattgcg 8520 

gacgttttta atgtactggg gtggtttttc ttttcaccag tgagacgggc aacagctgat 8580 

tgccottcac cgcctggccc tgagagagtt goagcaagcg gtccacgctg gtttgcccca 8640 

gcaggcgaaa atcctgtttg atggtggttc cgaaatcggc aaaatccctt ataaatcaaa 8700 

agaatagccc gagatagggt tgagtgttgt tccagtttgg aacaagagtc cactattaaa 8760 

gaacgtggac tccaacgtca aagggcgaaa aaccgtctat cagggcgatg gcccactacg 8820 

tgaacoatca cccaaatcaa gttttttggg gtcgaggtgc cgtaaagcac taaatcggaa 8880 

ccctaaaggg agecccegat ttagagcttg acggggaaag ccggcgaacg tggcgagaaa 8940 

ggaagggaag aaagcgaaag gagogggcgc cattcaggct gcgcaactgt tgggaagggc 9000 

gatcggtgcg ggcctcttcg ctattacgcc agctggcgaa agggggatgt gctgcaaggc 9060 

gattaagttg ggtaacgcca gggttttccc agtcaogacg ttgtaaaacg aeggccagtg 9120 

aattdittco catcttgaaa gaaatatagt ttaaatattt attgataaaa taacaagtca 9180 

ggtattatag tccaagcaaa aacataaatt tattgatgca agtttaaatt cagaaatatt 9240 

tcaataactg attatatcag ctggtacatt gcogtagatg aaagactgag tgogatatta 9300 
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tgtgtaatac ataaattgat gatatagota gcttagctca tcgggggatc cgtcgaagct 9360 
agcttgggtc cegctcagaa gaactcgtca agaaggogat agaaggcgat gcgctgcgaa 9420 
^ 'tcgggagcgg cgataccgta aagcacgagg aagcggtcag cccattcgcc gccaagctct 9480 
tcagcaatat cacgggtagc caacgctatg tcctgatagc ggtccgccac acccagccgg 9540 
ccacagtcga tgaatccaga aaagcggcca ttttccacca tgatattcgg caagcaggca 9600 
tcgccatggg tcacgacgag atcctcgccg tcgggcatgc gcgccttgag cctggcgaac 9660 
agttcggctg gcgcgagccc ctgatgctct tcgtccagat catcctgatc gacaagaccg 9720 
gcttccatcc gagtacgtgc tcgotcgatg cgatgtttcg cttggtggtc gaatgggcag 9780 
gtagccggat caagcgtatg cagccgccgc attgcatcag ccatgatgga tactttctcg 9840 
gcaggag<5.aa ggtgagatga caggagatcc tgccccggca cttcgcccaa tagcagccag 9900 
tccctteccg cttcagtgac aacgtcgagc acagctgcgc aaggaacgcc cgtcgtggcc 9960 
agccacgata gccgcgctgc ctcgtcctgc agttcattca gggcaccgga caggtcggtc 10020 
ttgacaaaaa gaaccgggcg cccctgcgct gacagccgga acacggcggc atcagagcag 10080 
ccgattgtct gttgtgccca gtcatagccg aatagcctct . ccacccaagc ggccggagaa 10140 
cctgcgtgca atccatcttg ttcaatccaa gctcccatgg gccctcgact agagtcgaga 10200 
tctggattga gagtgaatat gagactctaa ttggataccg aggggaattt atggaacgtc 10260 
agtggagcat ttttgacaag aaatatttgc tagctgatag tgaccttagg cgacttttga 10320 
acgcgcaata atggtttctg acgtatgtgc ttagctcatt aaactccaga aacccgcggc 10380 
tgagtggctc cttcaacgtt gcggttctgt cagttccaaa cgtaaaacgg cttgtcccgc 10440 
gtcatcggcg ggggtcataa cgtgactccc ttaattctcc gctcatgatc ttgatcccct 10500 
gcgccatcag atccttggcg goaagaaagc catccagttt actttgcagg gcttcccaac 10560 
cttaccagag ggcgccccag ctggcaattc cggttcgctt gctgtccata aaaccgccca 10620 
gtctagctat cgccatgtaa gcccactgca agctacctgc tttctctttg cgcttgcgtt 10680 
ttcccttgtc cagatagccc agtagctgae attcatoogg ggtcagcacc gtttctgcgg 10740 
actggctttc tacgtgttcc gcttccttta gcagcccttg cgccctgagt gcttgcggca 10800 
gcgtgaagct tgcatgcctg caggtcgacg gcgcgccgag ctcctcgagc aaatttacac 10860 
attgccacta aacgtctaaa cccttgtaat ttgtttttgt tttactatgt gtgttatgta 10920 
tttgatttgc gataaatttt tatatttggt actaaattta taacaccttt tatgctaacg 10980 
tttg6baaca cttagcaatt tgcaagttga ttaattgatt ctaaattatt tttgtcttct 11040 
aaatacatat aotaatcaac tggaaatgta aatatttgct aatatttcta ctataggaga lllOO 
attaaagtga gtgaatatgg taccacaagg tttggagatt taattgttgc aatgctgcat 11160 
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ggatggcata tacaccaaac attcaataat tcttgaggat aataatggta ccacacaaga 11220 

tttgaggtgc atgaacgtca cgtggacaaa aggtttagta atttttcaag acaacaatgt 11280 

taccacacac aagttttgag g'tgcatgcat ggatgccctg tggaaagttt aaaaatattt 11340 

tggaaatgat ttgcatggaa gccatgtgta aaaccatgac atccacttgg aggatgcaat 11400 

10 aatgaagaaa actacaaatt tacatgcaac tagttatgca tgtagtctat ataatgagga 11460 

ttttgcaata ctttcattca tacacactca ctaagtttta cacgattata atttcttcat 11520 

agccagcgga tccgatatcg ggcccgctag cgttaaccct gctttaatga gatatgcgag 11580 

15 

acgcctatga tcgcatgata tttgctttca attctgttgt gcacgttgta aaaaacctga 11640 

gcatgtgtag ctcagatcct taccgccggt ttcggttcat tctaatgaat atatcacccg 11700 

20 ttactatcgt atttttatga ataatattct ccgttcaatt tactgattgt ccgtcgacga 11760 

attcgagctc ggcgcgcctc tagaggatcg atgaattcag atcggctgag tggctccttc 11820 
I 

aacgttgcgg ttctgtcagt tccaaacgta aaacggcttg tcccgcgtca tcggcggggg 11880 

25 

tcataacgtg actcccttaa ttctccgctc atgatcagat tgtcgtttcc cgccttcagt 11940 

ttaaactatc agtgtttgac aggatatatt ggcgggtaaa. cctaagagaa aagagcgttt 12000 

30 attagaataa tcggatattt aaaagggcgt gaaaaggttt atccttcgtc catttgtatg 12060 

tgcatgccaa ccacagggtt cccca 12085 

35 <210> 29 

<211> 12079 
<212> nWA 

<213> artificial sequence 
40 <400> 29 

gatctggcgc cggccagcga gacgagcaag attggccgcc gcccgaaacg atccgacagc 60 

gcgcccagca caggtgcgca ggcaaattgc accaacgcat acagcgccag cagaatgcca 120 

45 tagtgggcgg tgacgtcgtt cgagtgaacc agatcgcgca ggaggcccgg cagcaccggc 180 

ataatcaggc cgatgccgac agcgtcgagc gcgacagtgc tcagaattac gatcaggggt 240 

atgttgggtt tcacgtctgg cctccggacc agcctccgct ggtccgattg aacgcgcgga 300 

50 

ttctttatca ctgataagtt ggtggacata ttatgt.ttat cagtgataaa gtgtcaagca 360 

tgacaaagtt gcagccgaat acagtgatcc gtgccgccct ggacctgttg aacgaggtcg 420 

55 gcgtagacgg tctgacgaca cgcaaactgg cggaacggtt gggggttcag cagccggcgc 480 

tttactggca cttcagga:ac aagcgggcgc tgctcgacgc actggccgaa gccatgctgg 540 

cggagaatca tacgcattcg gtgccgagag ccgacgacga ctggcgctca tttctgatcg 600 

ggaatgcccg cagcttcagg caggcgctgc tcgcctaccg cgatggcgcg cgcatccatg 660 
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ccggcacgcg 
gcgaggcggg 
ctgttggggc 
ccgttgaaca 
ccggtccgga 
ggaggctcgt 
tgccggagcg 
ccaccgcgtc 
ccaagcctca 
gctcactgac 
ggcggtaata 
aggcc^gcaa 
ccgcccccct 
aggactataa 
gaccctgccg 
ccgctgcata 
tcgcacgata 
ggcgtcagcc 
ctgtccctta 
ctaccgccgg 
agggcagccc 
aggcggcggc 
aaatcacggg 
tgggccgcct 
tcggtgatgc 
gcaaggtcat 
aacggccggg 
gacttcgcgg 
gacgctcacc 
cgcgccagaa 
cctcgcggaa 



accgggcgca 
tttttcggcc 
cgtgcttgag 
ggctccgctc 
cgcagcgttc 
tgtcaggaac 
caacccactc 
agacgcccgt 
cggccgcgct 
tcgctgcgct 
cggttatcca 
aaggccagga 
gacgagcatc 
agataccagg 
cttaccggat 
accctgcttc 
tacaggattt 
gggcaggata 
ttcgcacctg 
cgtaacagat 
acctatcaag 
ggccggcatg 
cgtcgtggac 
gggcggcctg 
cacgatcctc 
gatgggcgtg 
gggtgcgcgt 
agctggtgaa 
gggctggttg 
ac'gccgtcga 
aacttggccc 
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ccgcagatgg aaacggccga 
ggggacgccg tcaatgcgct 
gagcaggccg gcgacagcga 
tcgccgctgt tgcgggccgc 
gagcagggac tcgcggtgat 
gttgaatggac cgagaaaggg 
actacagcag agccatgtag 
agcagcccgc tacgggcttt 
cggcctctct ggcggccttc 
cggtcgttcg gctgcggcga 
cagaatcagg ggataacgca 
accgtaaaaa ggccgcgttg 
acaaaaatcg acgctcaagt 
cgtttccccc tggaagctcc 
acctgtccgc ctttctccct 
ggggtcatta tagcgatttt 
tgccaaaggg ttcgtgtaga 
ggtgaagtag gcccacccgc 
gcggtgctca acgggaatcc 
gagggcaagc ggatggctga 
gtgtactgcc ttccagacga 
agcctgtcgg cctacctgct 
tatgagcacg tccgcgagct 
ctgaaactct ggctcaccga 
gccctgctgg cgaagatcga 
gtccgcccga gggcagagcc 
gattgccaag caccrtcccca 
gtacatcacc gacgagcaag 
ccctcgccgc tgggctggcg 
agccgtgtgc gagacaccgc 
tcactgacag atgaggggcg 
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cgcgcagctt 
gatgacaatc 
tgccggcgag 
gatagacgcc 
tgtcgatgga 
tgacgattga 
acaacatccc 
ttcatgccct 
tggcgctctt 
gcggtatcag 
ggaaagaaca 
ctggcgtttt 
cagaggtggc 
ctcgtgcgct 
tcgggaagcg 
ttcggtatat 
ctttccttgg 
gagcgggtgt 
tgctctgcga 
tgaaaccaag 
acgaagagcg 
ggccgtcggc 
ggcccgcatc 
cgacccgcgc 
agagaagcag 
atgacttttt 
tgcgctccat 
gcaagaccga 
gccgtctatg 
ggccgccggc 
gacgttgaca 



cgcttcctct 
agctacttca 
cgcggcggca 
ttcgacgaag 
ttggcgaaaa 
tcaggaccgc 
ctcccccttt 
gccctagcgt 
ccgcttcctc 
ctcactcaaa 
tgtgagcaaa 
tccataggct 
gaaacccgac 
ctcctgttcc 
tggcgctttt 
ccatcctttt 
tgtatccaac 
tccttcttca 
ggctggccgg 
ccaaccagga 
attgaggaaa 
cagggctaca 
aatggcgacc 
acggcgcggt 
gacgagcttg 
tagccgctaa 
caagaagagc 
gcgcctttgc 
gccctgcaaa 
gttgtggata 
cttgaggggc 



720 
• 780 
840 
900 
960 
1020 
1080 
1140 
1200 
1260 
1320 
1380 
1440 
1500 
1560 
1620 
1680 
1740 
1800 
1860 
1920 
1980 
2040 
2100 
'2160 
2220 
2280 
2340 
2400 
2460 
2520 
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cgactcaccc 
gagctggcca 
gatgtggaca 
tgaca^atga 
gcacctattg 
ccgcccgttt 
aaaccttgtt 
tgccccccct 
tgcgcccctc 
ttgccgggat 
ttgacgtgcc 
gcggccjtggg 
cggggccggc 
tgttcggggg 
gtatgaaaac 
ctaccaagac 
tactgataag 
ggcaaggcat 
tgcatggact 
attgggtaat 
tgtcatgcag 
gctgcctcag 
gcagctttcc 
cgtcaaaggg 
atacgtgcgc 
gcgatttagc 
tgcccggctg 
cgtgttgagg 
catatcaatg 
ccatgtttta 
acgcaccacc 



ggcgcggcgt 
gcctcgcaaa 
agcctgggga 
srgggcgcgat 
acatttgagg 
ttcggccacc 
tttaaccagg 
tctcgaaccc 
ggccgcgaac 
cggggcagta 
gcaggtgctg 
tggcggcctg 
aatttttacc 
tgcgataaac 
gagaattgga 
gaagaggatg 
ataatatatc 
aggcagcgcg 
aatgcttgaa 
gactccaact 
ctccaccgat 
attcaggtta 
cttcaggcgg 
tgacagcagg 
aacaaccgtc 
cccgacatag 
tatgcgcgag 
ccaacgccca 
attttctgigt 
cggcagtgag 
ccgtcagtag 



70/111 

tgacagatga ggggcaggct 
tcggcgaaaa cgcctgattt 
t^agtgccct gcggtattga 
ccttgacact tgaggggcag 
ggctgtccac aggcagaaaa 
gctaatfctgt cttttaacct 
gctgcgccct gtgcgcgtga 
tcccggcccg ctaacgcggg 
ggcctcaccc caaaaatggc 
acgggatggg cgatcagccc 
gcatcgacat tcagcgacca 
cccttcactt cggccgtcgg 
ttgggcattc ttggcatagt 
ccagcgaacc atttgaggtg 
cctttacaga attactctat 
aagaggatga ggaggcagat 
ttttatatag aagatatcgc 
cttatcaata tatctataga 
acccaggaca ataaccttat 
tattgatagt gttttatgtt 
tttgagaacg acagcgactt 
tgccgctcaa ttcgctgcgt 
gattcataca gcggccagcc 
ctcataagac gccccagcgt 
ttccggagac tgtcatacgc 
ccccactgtt cgtccatttc 
gttaccgact gcggcctgag 
taatgcgggc tgttgcccgg 
gcgtaccggg ttgagaagcg 
agcagagata gcgctgatgt 
ctgaacagga gggacagctg 
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cgatttcggc 
tacgcgagtt 
cacttgaggg 
agtgctgaca 
tccagcattt 
gcttttaaac 
ccgcgcacgc 
cctcccatcc 
agcgctggca 
gagcgcgacg 
ggtgccgggc 
ggcattcacg 
ggtcgcgggt 
ataggtaaga 
gaagcgccat 
tgccttgaat 
cgtatgtaag 
atgggcaaag 
agcttgtaaa 
cagataatgc 
ccgtcccagc 
atatcgcttg 
atccgtcatc 
cgccatagtg 
gtaaaacagc 
cgcgcagacg 
ttttttaagt 
catccaacgc 
gtgtaagtga 
ccggcggtgc 
atagacacag 



cggcgacgtg 
tcccacagat 
gcgcgactac 
gatgaggggc 
gcaagggttt 
caatatttat 
cgaagggggg 
ccccaggggc 
gtccttgcca 
cccggaagca 
agtgagggcg 
gacttcatgg 
gccgtgctcg 
ttataccgag 
atttaaaaag 
atattgacaa 
gatttcaggg 
cataaaaact 
ttctatcata 
ccgatgactt 
cgtgccaggt 
ctgattacgt 
catatcacca 
cgttcaccga 
cagcgctggc 
atgacgtcac 
gacgtaaaat 
cattcatggc 
actgcagttg 
ttttgccgtt 
aagccactgg 



2580 
•2640 
2700 
2760 
2820 
2880 
2940 
3000 
3060 
3120 
3180 
3240 
3300 * 
3360 
3420 
3480 

3540 

3600 

3660 

3720 

3780 

3840 

3900 

3960 

4020 

4080 

4140 

4200 

4260 

4320 

4380 
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agcacctcaa aaacaccatc atacactaaa tcagtaagtt ggcagcatca cccataattg 4440 

tggtttcaaa atcggctccg tcgatactat gttatacgcc aactttgaaa acaactttga 4500 

5 aaaagctgtt ttctggtatt taaggtttta gaatgcaagg aacagtgaat tggagttcgt 4560 

cttgttataa ttagcttctt ggggtatctt taaatactgt agaaaagagg aaggaaataa 4620 

taaatggcta aaatgagaat atcaccggaa ttgaaaaaac tgatcgaaaa ataccgctgc 4680 

gtaaaagata cggaaggaat gtctcctgct aaggtatata agctggtggg agaaaatgaa 4740 

aacctatatt taaaaatgac ggacagocgg tataaaggga ccacctatga tgtggaacgg 4800 

15 gaaaaggaca tgatgctatg gctggaagga aagctgcctg ttccaaaggt cctgcacttt 4860 

gaacggcatg atggctggag caatctgctc atgagtgagg ccgatggcgt cctttgctcg 4920 

^ gaagagtatg aagatgaaea aagccctgaa aagattatcg agctgtatgc ggagtgcatc 4980 

aggctctttc actccatcga catatcggat tgtccctata cgaatagctt agacagccgc 5040 

ttagcdgaat tggattactt actgaataac gatctggccg atgtggattg cgaaaactgg Sloo 

25 gaagaagaca ctccatttaa agatccgcgc gagctgtatg attttttaaa gacggaaaag 5160 

cccg^agagg aacttgtctt ttoccaoggc gacctgggag acagcaaoat ctttgtgaaa 5220 

^ gatggcaaag taagtggctt tattgatctt gggagaagcg gcagggcgga caagtggtat 5280 

gacattgcct tctgcgtccg gtcgatcagg gaggatatcg gggaagaaca gtatgtcgag 5340 

ctattttttg acttactggg gatcaagcct gattgggaga aaataaaata ttatatttta 5400 

35 ctggatgaat tgttttagta cctagatgtg gcgcaacgat gccggcgaca agcaggagcg 5460 

caccgacttc ttcegcatca agtgttttgg ctctcaggcc gaggcccacg gcaagtattt ' 5520 

^ gggcaagggg tcgctggtat tcgtgcaggg caagattcgg aataccaagt acgagaagga 5580 

cggccagacg gtctacggga ccgacttcat tgccgataag gtggattatc tggacaccaa 5640 

ggcaccaggc gggtcaaatc aggaataagg gcacattgcc ccggcgtgag tcggggcaat 5700 

45 cccgcaagga gggtgaatga atcggacgtt tgaccggaag gcatacaggc aagaactgat 5760 

cgacgcgggg ttttccgccg aggatgccga aaccatcgca agccgcaccg tcatgcgtgc 5820 

^ gccccgogaa aocttccagt ccgtcggctc gatggtccag oaagctacgg ccaagatcga 5880 

gcgcgacagc gtgcaactgg ctccccctgc cctgcoogcg ccatcggocg ccgtggagcg 5940 

ttcgcgtcgt ctcgaacagg aggcggcagg tttggcgaag tcgatgacca tcgacacgcg 6000 

55^ aggaactatg acgaccaaga agcgaaaaac cgccggcgag gacctggcaa aacaggtcag 6060 

ogfggccaag caggccgcgt tgctgaaaca cacgaagcag cagatcaagg aaatgcagct 6120 

ttccttgttc gatattgcgc cgtggccgga cacgatgcga gcgatgccaa acgacacggc 6180 

ccgctctgcc ctgttcacca cgcgcaaoaa gaaaatcccg cgcgaggcgc tgcaaaacaa 6240 
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ggtcattttc 
cgacgatgac 
cgagccgatc 
ccggtaettac 
cacgtccgac 
ggaccgtggc 
gtttgctggc 
ggcccgacgg 
aaccttccgc 



cggcgaagcc 
tgacctggtg 
agccagpgct 
tcagtatcgc 
ttgacaattg 
cgcgagatcc 
cacgaggaga 
ggcgcctaca 
aaggacgctc 
ggggtcgccg 
cgacagattc 
tcgctattct 
acggtaggcg 
ccgatacgat 
gtgttgacac 
gtttccatgg 
acctttaccg 
tttgatccgc 
ctgatcggag 
acagttgttt 
catcaggccg 
aorgggagttg 



cacgtcaaca 
gaactggtgt 
accttcacgt 
acgaaggccg 
cgcgttgggc 
aagaaaacgt 
gaccactaca 
atgttcgact 
ctcatgtgcg 
tgcgaagagt 
cattgcaaa[c 
ttactggcat 
tcgggacgca 
tgattaaggc 
gattgtcggc 
aaaagcccat 
tcgacggcga 
acaaggcgca 
gtatgctgct 
caacgggaat 
ggagcttgtt 
ctgtgcagcc 
tgatggcggt 
caaacgcagc 
cgttcggaac 
cctggcaact 
caatcccgat 
cgggtttaac 
ccttactggg 
acagtcggaa 
atatcgtcaa 
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aggacgtgaa gatcacctac 
ggcagcaggt gttggagtac 
tctacgagct ttgccaggac 
aggaatgcct gtcgcgccta 
acctggaatc ggtgtcgctg 
cccgttgcca ggtcctgatc 
cgaaattcat atgggagaag 
atttcagctc gcaccgggag 
gatcggattc cacccgcgtg 
tgcgaggcag cggcctggtg 
gctagggcct tgtggggtca 
ttcaggaaca agcgggcact 
cggcgcgctc tacgaactgc 
tcagattcga cggcttggag 
cctgaagaaa gctccagaga 
ggaggcgttc gctgaacggt 
gatcattggg ctgtcggtct 
tctgtccggc gttttcgtgg 
srcgggcgttg ccggcgggtt 
ctggtggatg cgcatcttca 
gtttatttcg gtctaccgcc 
gctgatggtc gtgttcatct 
cctgggggct atttgcggaa 
gctagatcct gtcggcgtcg 
cgtgctgacc cgcaagtggc 
ggcggccgga ggacttctgc 
gcctacagga accaatgttc 
ctacttcctt tggttccggg 
ctttetcagc cccagatctg 
cttcgggtcc ccgacctgta 
cgttcacttc taaagaaata 
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accggcgtcg 
gcgaagcgca 
ctgggctggt 
caggcgacgg 
ctgcaccgct 
gacgaggaaa 
taccgcaagc 
ccgtacccgc 
aagaagtggc 
gaacacgcct 
gttccggctg 
gctcgacgca 
cgataaacag 
cggccgacgt 
tgttcgggtc 
tgcgagatgc 
tcaaacagga 
agcccgaaca 
tattgctcgt 
tcctcggcgc 
tgccgggcgg 
ctgccgctct 
ctgcgggcgt 
cagcgggcct 
aacctcccgt 
tcgttccagt 
tcggcctggc 
ggatctcgcg 
gggtcgatca 
ccattcggtg 
gcgccactca 



agctgcgggc 
cccctatcgg 
cgatcaatgg 
cgatgggctt 
tccgcgtcct 
tcgtcgtgct 
tgtcgccgac 
tcaagctgga 
gcgagcaggt 
gggtcaatga 
ggggttcagc 
cttgcttcgc 
aggattaaaa 
gcaggatttc 
cgtttacgag 
cgtggcattc 
gtfacggcccc 
gcgaggccga 
gatgatcgtc 
acttaatatt 
ggtcgcggcg 
gctaggtagc 
ggcgctgttg 
9Srcgggggcg 
gcctctgctc 
agctttagtg 
gtggctcggc 
actcgaacct 
gccggggatg 
agcaatggat 
gcttcctcag 



6300 

6360 
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6480 

6540 

6600 
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6780 
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6960 
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7200 
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7560 

7620 

7680 

7740 

7800 

7860 

7920 

7980 

8040 

8100 
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10 



cggctttatc 
cggttaagcg 
5 tttgatcaca 
tcatcegtgt 
gagcaaagtc 
gcctgtatcg 
tggcaggata 
15 gacgttttta 
tgcccttcac 
gcaggcgaaa 

20 

agaatagccc 
gaacgtiggac 
25 tgaaccatca 
ccctaaaggg 
ggaagggaag 

30 

gatcggtgcg 
gattaagttg 
35 aattaattcc 
ggtattatag 
tcaataactg 

40 

tgtgtaatac 
agcttgggtc 
45 tcgggagcgg 
tcagcaatat 
ccacagtcga 

50 

tcgccatggg 
agttcggctg 
55 gcttccatcc 
gtftgccggat 
gcaggagcaa 



60 



tcccttcccg 



cagcgatttc 
agaaatgaat 
ggcagcaacg 
ttcaaacccg 
tgccgcctta 
agtggtgatt 
tattgtggtg 
atgtactggg 
cgcctggccc 
atcctgtttg 
gagatagggt 
tccaacgtca 
cccaaatcaa 
agcccccgat 
aaagcgaaag 
ggcctcttcg 
ggtaacgcca 
catcttgaaa 
tccaagcaaa 
attatatcag 
ataaattgat 
ccgctcagaa 
cgatacccrta 
cacgggtagc 
tgaatccaga 
tcacgacgag 
gcgcgagqcc 
gagtacgtgc 
caagcgta'tg 
ggtgagatga 
cttcagtgac 
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ctattatgtc ggcatagttc 
aagaaggctg ataattcgga 
ctctgtcatc gttacaatca 
gcagcttagt tgccgttctt 
caacggctct cccgctgacg 
ttgtgcbgag ctgccggtcg 
taaacaaatt gacgcttaga 
gtggtttttc ttttcaccag 
tgagagagtt gcagcaagcg 
atggtggttc cgaaatcggc 
tgagtgttgt tccagtttgg 
aagggcgaaa aaccgtctat 
gttttttggfg gtcgaggtgc 
ttagagcttg acggggaaag 
gagcgggcgc cattcaggct 
ctattacgcc agctggcgaa 
gggttttccc agtcacgacg 
gaaatatagt ttaaatattt 
aacataaatt tattgatgca 
ctggtacatt gccgtagatg 
gatatagcta gcttagctca 
gaactcgtca agaaggcgat 
aagcacgagg aagcggtcag 
caacgctatg tcctgatagc 
aaagcggcca ttttccacca 
atcctcgccg tcgggcatgc 
ctgatgctct tcgtccagat 
tcgctcgatg cgatgtttcg 
cagccgccgc attgcatcag 
caggagatcc tgccccggca 
aacgtcgagc acagctgcgc 
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tcaagatcga 
tctctgcgag 
acatgctacc 
ccgaatagca 
ccgtcccgga 
gggagctgtt 
caacttaata 
tgagacgggc 
gtccacgctg 
aaaatccctt 
aacaagagtc 
cagggcgatg 
cgtaaagcac 
ccggcgaacg 
gcgcaactgt 
agggggatgt 
ttgtaaaacg 
attgataaaa 
agtttaaatt 
aaagactgag 
tcgggggatc 
agaaggcgat 
cccattcgcc 
ggtccgccac 
tgatattcgg 
gcgccttgag 
catcctgatc 
cttggtggtc 
ccatgatgga 
cttcgcccaa 
aaggaacgcc 



cagcctgtca 
ggagatgata 
ctccgcgaga 
tcggtaacat 
ctgatgggct 
ggctggctgg 
acacattgcg 
aacagctgat 
gtttgcccca 
ataaatcaaa 
cactattaaa 
gcccactacg 
taaatcggaa 
tggcgagaaa 
tgggaagggc 
gctgcaaggc 
acggccagtg 
taacaagtca 
cagaaatatt 
tgcgatatta 
cgtcgaagct 
gcgctgcgaa 
gccaagctct 
acccagccgg 
caagcaggca 
cctggcgaac 
gacaagaccg 
gaatgggcag 
tactttctcg 
tagcagccag 
cgtcgtggcc 



8160 
'8220 
8280 
8340 
8400 
8460 
8520 
8580 
8640 
8700 
8760 
8820 
8880 
8940 
9000 
9060 
9120 
9180 
9240 
9300 
9360 
9420 
9480 
9540 
9600 
9660 
9720 
9780 
9840 
9900 
9960 
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agccacgata gccgcgctgc ctcgtcctgc agttcattca gggcaccgga caggtcggtc 10020 
ttgacaaaaa gaaccgggcg cccctgcgct gacagccgga acacggcggc atcagagcag 10080 
5 ccgattgtct gttgtgccca gtcatagecg aatagcctct ccacccaagc ggccggagaa 10140 
cctgcgtgca atccatcttg ttcaatceaa gctcccatgg gccctcgact agagtcgaga 10200 
tetggattga gagtgaatat gagactctaa ttggataccg aggggaattt atggaacgtc 10260 
agtggagcat ttttgacaag aaatatttgc tagctgatag tgaccttagg cgacttttga 10320 
acgcgcaata atggtttctg acgtatgtgc ttagctcatt aaactccaga aacccgcggc 10380 
t5 tgagtggctc cttcaacgtt gcggttctgt cagttccaaa cgtaaaacgg cttgtcccgc 10440 
gtcatcggcg ggggtcataa cgtgactccc ttaattctcc gctcatgatc ttgatcccct 10500 
gcgccatcag atccttggcg gcaagaaagc catccagttt actttgcagg gcttcccaac 10560 
cttaccagag ggcgccccag ctggcaattq, cggttcgctt gctgtccata aaaccgccca 10620 
gtctagptat cgocatgtaa gcccactgca agctacctgc tttctetttg cgcttgogtt 10680 
25 ttcccttgtc cagatagccc agtagctgac attcatccgg ggtcagcacc gtttctgcgg 10740 
actggptttc tacgtgttcc gcttccttta gcagcccttg cgccctgagt gcttgcggca 10800 
^ gcgtgaagct tgcatgcctg caggtcgacg gcgcgccgag ctcctcgagc aaatttacac 10860 
attgccacta aacgtctaaa cccttgtaat ttgtttttgt tttactatgt gtgttatgta 10920 
tttgatttgc gataaatttt tatatttggt actaaattta taacaccttt titgctaacg 10980 
35 tttgccaaca cttagcaatt tgcaagttga ttaattgatt ctaaattatt tttgtcttct 11040 
aaatacatat actaatcaac tggaaatgta aatatttgct aatatttcta ctataggaga 11100 
attaaagtga gtgaatatgg taccacaagg tttggagatt taattgttgc aatgctgcat 11160 
ggatggcata tacaccaaac attcaataat tcttgaggat aataatggta coacacaaga 11220 
tttgaggtgc atgaacgtca cgtggacaaa aggtttagta atttttcaag acaacaatgt 11280 
45 taccacacac aagttttgag gtgcatgcat ggatgccctg tggaaagttt aaaaatattt 11340 
tggaaatgat ttgcatggaa gccatgtgta aaaccatgac atcoacttgg aggatgcaat 11400 
^ aatgaagaaa actacaaatt tacatgcaac tagttatgca tgtagtctat ataatgagga 11460 
ttttgcaata ctttcattca tacacactoa otaagtttta cacgattata atttcttcat 11520 
agccagcaga tctgccggca tcgatcccgg gccatggcct gctttaatga gatatgogag 11580 
55^ acgcctatga tcgcatgata tttgctttca attctgttgt gcacgttgta aaaaacctga 11640 
gcejtgtgtag ctcagatcet taccgccggt ttcggttcat tctaatgaat atatcacccg 11700 
^ ttactatcgt attcttatga ataatattct ccgttcaatt tactgattgt ccgtcgacga 11760 
gctcggcgcg cctotagagg atcgatgaat tcagatcggc tgagtggctc cttcaacgtt 11820 
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75/111 

gcggttctgt cagttccaaa cgtaaaacgg cttgtcccgc gtcatcggcg ggggtcataa 11880 

cgtgactccc ttaattctcc gctcatgatc agattgtcgt ttcccgcctt cagtttaaac 11940 

5 tatcagtgtt tgacaggata tattggcggg taaacctaag agaaaagagc gtttattaga 12000 

^.^ ataattggat atttaaaagg gcgtgaaaag gtttatcctt cgtccatttg tatgtgcatg 12060 

ccaaccacag ggttcccca 12079 



<210> 30 
<211> 13002 
<212> DNA 

<213> artificial se<3[uence 
- <22'0> 

<223> pflanzlicher Expressionsvektor mit zwei Promotor-Terminator-Expre 

ssionskassetten ^ 

<400> 30 

gatctgfircgc cggccagcga gacgagcaag attggccgcc gcccgaaacg atcogaoagc 60 

gcgcccagca caggtgcgca ggcaaattgc accaacgcat acagcgccag cagaatgcca 120 

tagtgggcgg tgacgtcgtt cgagtgaacc agatcgcgca ggaggcccgg cagcaccggc 180 

ataatcaggc cgatgccgac agcgtcgagc gcgacagtgc tcagaattac gatcaggggt 240 

atgttgggtt tcacgtetgg cctccggacc agcctccgct ggtccgattg aacgcgcgga 300 

ttctttatca ctgataagtt ggtggacata ttatgtttat cagtgataaa gtgtcaagca 360 

tgacaaagtt gcagccgaat acagtgatcc gtgccgccct ggacctgttg aacgaggtcg 420 

gcgtagacgg tctgacgaca cgcaaactgg cggaacggtt gggggttcag cagccggcgc 480 

tttactggca cttcaggaac aagcgggcgc tgctcgacgc actggcegaa gccatgctgg 540 

cggagaatca tacgcattog gtgccgagag ccgacgacga ctggcgctca tttctgatcg 600 

ggaatgccog cagcttcagg caggcgctgc tcgcctaccg cgatggogcg cgcatccatg 660 

ccggcaogcg accgggcgca cc&cagatgg aaacggccga cgcgcagctt cgcttcctct 720 

gcgaggcggg tttttcggcc ggggacgocg tcaatgcgct gatgacaatc agctacttca 780 

ctgttggggc cgtgcttgag gagcaggccg gcgacagcga t^ccggcgag cgcggcggca 840 

ccgttgaaca ggctccgctc tcgccgctgt tgcgggccgc gatagacJgcc ttcgacgaag 900 

ccggtccgga cgcagcgttc gagcagggac tcgcggtgat tgtcgatgga ttggcgaaaa 960 

ggaggctcgt tgtcaggaac gttgaaggac cgagaaaggg tgacgattga tcaggaccgc 1020 

tgccggagcg caacccactc actacagcag agccatgtag acaacatccc ctcccccttt 1080 

ccacbgcgtc agacgcccgt agoagoccgc tacgggcttt ttcatgccct gcoctagcgt ' 1140 

ccaagcctca cggccgcgct cggcctctct ggcggccttc tggcgctctt ocgottcctc 1200 

gctcactgac tcgctgcgct cggtcgttcg gctgcggcga gcggtatcag ctcactCaaa 1260 
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ggcggtaata 
aggccagcaa 
ccgcccccct 
aggactataa 
gaccctgccg 
ccgctgcata 
tcgcacgata 
ggcgtcagcc 
ctgtccctta 
ctaccgccgg 



agggcag'ccc 
I 

aggcggcggc 
aaatcacggg 
tgggccgcct 
tcggtgatgc 
gcaaggtcat 
aacggccggg 
gacttcgcgg 
gacgctcacc 
cgcgccagaa 
cctcgcggaa 
cgactcaccc 
gagctggcca 
gatgtggaca 
tgacagatga 
gcacctattg 
ccgcccgttt 
aaaccttgtt 
tgccccccct 
tgcgcccctc 
ttgccgggat 



cggttatcca 
aaggccagga 
gacgagcatc 
agataccagg 
cttaccggat 
accctgcttc 
tacaggattt 
gggcaggata 
ttcgcacctg 
cgtaacagat 
acctatcaag 
ggccggcatg 
cgtcgtggac 
gggcggcctg 
cacgatcctc 
gatgggcgtg 
gggtgcgcgt 
agctggtgaa 
gggctggttg 
acgccgtcga 
aacttggccc 
ggcgcggcgt 
gcctcgcaaa 
agcctgggga 

ggggcgcgat 

acatttgagg 
ttcggccacc 
tttaaccagg 
tctcgaaccc 
ggccgcgaac 
cggggcagta 



ca'gaatcagg 
accgtaaaaa 
acaaaaatcg 
cgtttccccc 
acctgtccgc 
ggggtcatta 

tgccaaaggg 
ggtgaagtag 
gcggtgctca 
gagggcaagc 
gtgtactgcc 
agcctgtcgg 
tatgagcacg 
ctgaaactct 
gccctgctgg 
gtccgcccga 
gattgccaag 
gtacatcacc 
ccctcgccgc 
agccgtgtgc 
tcactgacag 
tgacagatga 
tcggcgaaaa 
taagtgccot 
ccttgacact 
ggctgtccac 
gctaacctgt 
gctgcgccct 
tcccggcccg 
ggcctcaccc 
acgggatggg 



ggataacgca 
ggccgcgttg 
acgctcaagt 
tggaagctcc 
ctttctccct 
tagcgatttt 
ttcgtgtaga 
gcccacccgc 
acgggaatcc 
ggatggctga 
ttccagacga 
cctacctgct 
tccgcgagct 
ggctcaccga 
cgaagatcga 
gggcagagcc 
cacgtcccca 
gacgagcaag 
tgggctggcg 
gagacaccgc 
atgaggggcg 

ggggcaggct 

cgcctgattt 
gcggtattga 
tgaggggcag 
aggcagaaaa 
cttttaacct 
gtgcgcgtga 
ctaacgcggg 
caaaaatggc 
cgatcagccc 



ggaaagaaca 
ctggcgtttt 
cagaggtggc 
ctcgtgcgct 
tcgggaagcg 
ttcggtatat 
ctttccttgg 
gagcgggtgt 
tgctctgcga 
tgaaaccaag 
acgaagagcg 
ggccgtcggc 
ggcccgcatc 
cgacccgcgc 
agagaagcag 
atgacttttt 
tgcgctccat 
gcaagaccga 
gccgtctatg 
ggccgccggc 
gacgttgaca 
cgatttcggc 
tacgcgagtt 
cacttgaggg 
agtgctgaca 
tccagcattt 
gcttttaaac 
ccgcgcacgc 
cctcccatcc 
agcgctggca 
gagcgcgacg 



tgtgagcaaa 
tccataggct 
gaaacccgac 
ctcctgttcc 
tggcgctttt 
ccatcctttt 
tgtatccaac 
tccttcttca 
ggctggccgg 
ccaaccagga 
attgaggaaa 
cagggctaca 
aatggcgacc 
acggcgcggt 
gacgagcttg 
tagccgctaa 
caagaagagc 
gcgcctttgc 
gccctgcaaa 
gttgtggata 
cttgaggggc 
cggcgacgtg 
tcccacagat 
gcgcgactac 
gatgaggggc 
gcaagggttt 
caatatttat 
cgaagggggg 
ccccaggggc 
gtccttgcca 
cccggaagca 



1320 

1380 

1440 

1500 

1560 

1620 • 

1680 

1740 

1800 

1860 

1920 

1980 

2040 

2100 

2160 

2220 

2280 
. 2340 

2400 

2460 

2520 

2580 

2640 

2700 

2760 

2820 

2880 

2940 
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3060 

3120 
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10 



15 



20 



25 



30 



35 



40 



45 



50 



55 



60 



ttgacgtgcc 
gcggcctggg 
cggggccggc 
tgttcggggg 
gtatgaaaac 
ctaccaagac 
tactgataag 
ggcaaggcat 
tgcatggact 
attgggtaat 

tgtcat'gcag 

t 

gctgcctcag 
gcagctttcc 
cgtcaaaggg 
atacgtgcgc 
gcgatttagc 
tgcccggctg 
cgtgttgagg 
catatcaatg 
ccatgtttta 
acgcaccacc 
agcacctcaa 
tggtttcaaa 
aaaagctgtt 
cttgttataa 
taaatggcta 
gtaaaagata 
aacctatatt 
gaaa'aggaca 
gaacggcatg 
gaagagtatg 



gcaggtgctg gcatcgacat tcagcgacca 
tggcggcctg cccttcactt cggccgtcgg 
aatttttacc ttgggcattc ttggcatagt 
tgcgataaac ccagcgaacc atttgaggtg 
gagaattgga cctttacaga attactctat 
gaagaggatg aagaggatga ggaggcagat 
ataatatatc ttttatatag aagatatcgc 
aggcagcgcg cttatcaata tatctataga 
aatgcttgaa acccaggaca ataaccttat 
gactccaact tattgatagt gttttatgtt 
ctccaccgat tttgagaacg acagcgactt 
attcaggtta tgccgctcaa ttcgctgcgt 
cttcaggcgg gattcataca gcggccagcc 
tgacagcagg ctcataagac gccccagcgt 
aacaaccgtc ttccggagac tgtcatacgc 
cccgacatag ccccactgtt cgtccatttc 
tatgcgcgag gttaccgact gcggcctgag 
ccaacgccca taatgcgggc tgttgcccgg 
attttctggt gcgtaccggg ttgagaagcg 
cggcagtgag agcagagata gcgctgatgt 
ccgtcagtag ctgaacagga gggacagctg 
aaacaccatc atacactaa'a tcagtaagtt 
atcggctccg tcgatactat gttatjacgcc 
ttctggtatt taaggtttta gaatgcaagg 
ttagcttctt ggggtatctt taaatactgt 
aaatgagaat atcaccggaa ttgaaaaaac 
cggaaggaat gtctcctgct aaggtatata 
taaaaatgac ggacagccgg tataaaggga 
tgatgctatg gctggaagga aagctgcctg 
atggctggag caatctgctc atgagtgagg 
aagatgaaca aagccctgaa aagattatcg 



ggtgccgggc 
ggcattcacg 
ggtcgcgggt 
ataggtaaga 
gaagcgccat 
tgccttgaat 
cgtatgtaag 
atgggcaaag 
agcttgtaaa 
cagataatgc 
ccgtcccagc 
atatcgcttg 
atccgtcatc 
cgccatagtg 
gtaaaacagc 
cgcgcagacg 
ttttttaagt 
catccaacgc 
gtgtaagtga 
ccggcggtgc 
atagacacag 
ggcagcatca 
aactttgaaa 
aacagtgaat 
agaaaagagg 
tgatcgaaaa 
agctggtggg 
ccacctatga 
ttccaaaggt 
ccgatggcgt 
agctgtatgc 



agtgagggcg 
gacttcatgg 
gccgtgctcg 
ttataccgag 
atttaaaaag 
atattgacaa 
gatttcaggg 
cataaaaact 
ttctatcata 
ccgatgactt 
cgtgccaggt 
ctgattacgi: 
catatcacca 
cgttcaccga 
cagcgctggc 
atgacgtcac 
gacgtaaaat 
cattcatggc 
actgcagttg 
ttttgccgtt 
aagccactgg 
cccataattg 
acaactttga 
tggagttcgt 
aaggaaataa 
ataccgctgc 
agaaaatgaa 
tgtggaacgg 
cctgcacttt 
cctttgctcg 
ggagtgcatc 



3180 
3240 
3300 
3360 
3420 
3480 
3540 
3600 
3660 
3720 
3780 
3840 
3900 
3960 
4020 
4080 
4140 
4200 
4260 
4320 
4380 
4440 
4500 
4560 
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4800 
4860 
4920 
4980 
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aggctctttc 
ttagccgaat 
'gaagaagaca 
cccgaagagg 
gatggcaaag 
gacattgcct 
ctattttttg 
ctggatgaat 
caccgacttc 
gggcaaggcrg 



cggccagacg 
ggcaccaggc 
cccgcaagga 
cgacgcgggg 
gccccgcgaa 
gcgcgacagc 
ttcgcgtcgt 
aggaactatg 
cgaggcc^ag 
ttccttgttc 
ccgctctgcc 
ggtcattttc 
cgacgatgac 
cgagccgatc 
ccggtattac 
cacgtccgac 
ggaccgtggc 
gtttgctggc 
ggccdgacgg 
aaccttccgc 
cggcgaagcc 



actccatcga 
tggattactt 
ctccatttaa 
aacttgtctt 
taagtggctt 
tctgcgtccg 
acttactggg 
tgttttagta 
ttccgcatca 
tcgctggtat 
gtctacggga 
gggtcaaatc 
Srggtgaatga 
ttttccgccg 
accttccagt 
gtgcaactgg 
ctcgaacagg 
acgaccaaga 
caggccgcgt 
gatattgcgc 
ctgttcacca 
cacgtcaaca 
gaactggtgt 
accttcacgl: 
acgaaggccg 
cgcgttgggc 
aagaaaacgt 
gaccactaca 
atgttcgact 
ctcatgtgcg 
tgcgaagagt 



catatcggat 
actgaataac 
agatccgcgc 
ttcccacggc 
tattgatctt 
gtcgatcagg 
gatcaagcct 
cctagatgtg 
agtgttttgg 
tcgtgcaggg 
ccgacttcat 
aggaataagg 
atcggacgtt 
aggatgccga 
ccgtcggctc 
ctccccctgc 
aggcggcagg 
agcgaaaaac 
tgctgaaaca 
cgtggccgga 
cgcgcciacaa 
aggacgtgaa 
ggcagcaggt 
tctacgagct 
aggaatgcct 
acctggaatc 
cccgttgcca 
cgaaattcat 
atttcagctc 
gatcggattc 
tgcgaggcag 



tgtccctata 
gatctggccg 
gagctgtatg 
gacctgggag 
gggagaagcg 
gaggatatcg 
gattgggaga 
gcgcaacgat 
ctctcaggcc 
caagattcgg 
tgccgataag 
gcacattgcc 
tgaccggaag 
aaccatcgca 
gatggtccag 
cctgcccgcg 
tttggcgaag 
cgccggcgag 
cacgaagcag 
cacgatgcga 
gaaaatcccg 
gatcacctac 
gttgg^gtac 
ttgccaggac 
gtcgcgccta 
ggtgtcgctg 
ggtcctgatc 
atgggagaag 
gcaccgggag 
cacccgcgtg 
cggcctggtg 



cgaatagctt 
atgtggattg 
attttttaaa 
acagcaacat 
gcagggcgga 
gggaagaaca 
aaataaaata 
gccggcgaca 
gaggcccacg 
aataccaagt 
gtggattatc 
ccggcgtgag 
gcatacaggc 
■agccgcaccg 
caagctacgg 
ccatcggccg 
tcgatgacca 
gacctggcaa 
cagatcaagg 
gcgatgccaa 
cgcgaggcgc 
accggcgtcg 
gcgaagcgca 
ctgggctggt 
caggcgacgg 
ctgcaccgct 
gacgaggaaa 
taccgcaagc 
ccgtacccgc 
aagaagtggc 
gaacacgcct 



agacagccgc 
cgaaaactgg 
gacggaaaag 
ctttgtgaaa 
caagtggtat 
gtatgrtcgag 
ttatatttta 
agcaggagcg 
gcaagtattt 
acgagaagga 
tggacaccaa 
tcggggcaat 
aagaactgat 
tcatgcgtgc 
ccaagatcga 
ccgtggagcg 
tcgacacgcg 
aacaggtcag 
aaatgcagct 
acgacacggc 
tgcaaaacaa 
agctgcgggc 
cccctatcgg 
cgatcaatgg 
cgatgggctt 
tccgcgtcct 
tcgtcgtgct 
tgtcgccgac 
tcaagctgga 
gcgagcaggt 
gggtcaatga 



5040 

5100 

5160 

5220 

5280 

5340 

5400 

5460 

5520 

5580 

5640 

5700 

5760 

5820 

5880 

5940 

6000 

6060 

6120 

6180 

6240 

6300 

6360 

6420 

6480 

6540 

6600 

6660 

6720 

6780 

6840 



wo 2004/076617 



79/111 



PCT/EP2004/000771 



tgacctggtg 
agccagcgct 
' tcagtatcgc 
ttgacaattg 
cgcgagatcc 
cacgaggaga 
ggcgcctaca 
aagrgacgctc 

ggggtcgccg 

cgacagattc 

tcgctattct 

( 

acggtaggcg 
ccgatacgat 
gtgttgacac 
gtttccatgg 
acctttaccg 
tttgatccgc 
ctgatcggag 
acagttgttt 
catcaggccg 
aggggagttg 
cggctttatc 
cggttaagcg 
tttgatcaca 
tcatccgtgt 
gagcaaagtc 
gcctgtatcg 
tggcaggata 
gacglrtttta 
tgcccttcac 
gcaggcgaaa 



cattgcaaac 
ttactggcat 
tcgggacgca 
tgattaaggc 
gattgtcggc 
aaaagcccat 
tcgacggcga 
acaaggcgca 
gtatgctgct 
caacgggaat 
ggagcttgtt 
ctgtgcagcc 
tgatggcggt 
caaacgcagc 
cgttcggaac 
cctggcaact 
caatcccgat 
cgggtttaac 
ccttactggg 
acagtcggaa 
atatcgtcaa 
cagcgatttc 
agaaatgaat 
ggcagcaacg 
ttcaaacccg 
tgccgcctta 
agtggtgatt 
tattgtggtg 
atgtactggg 
cgcctggccc 
atcctgtttg 



gctagggcct 
ttcaggaaca 
cggcgcgctc 
tcagattcga 
cctgaagaaa 
ggaggcgttc 
gatcattggg 
tctgliccggc 
gcgggcgttg 
ctggtggatg 
gtttatttcg 
gctgatggtc 
cctgggggct 
gctagatcct 
cgtgctgacc 
ggcggccgga 
gcctacagga 
ctacttcctt 
ctttctcagc 
cttcgggtcc 
cgttcacttc 
ctattatgtc 
aagaaggctg 
ctctgtcatc 
gcagcttagt 
caacggctct 
ttgtgccgag 
taaacaaatt 
gtggtttttc 
tgagagagtt 
atggtggttc 



tgtggggtca 
agcgggcact 
tacgaactgc 
cggcttggag 
gctccagaga 
gctgaacggt 
ctgtcggtct 
gttttcgtgg 
ccggcgggtt 
cgcatcttca 
gtctaccgcc 
gtgttcatct 
atttgcggaa 
gtcggcgtcg 
cgcaagtggc 
ggacttctgc 
accaatgttc 
tggttccggg 
cccagatctg 
ccgacctgta 
taaagaaata 
ggcatagttc 
ataattcgga 
gttacaatca 
tgccgttctt 
cccgctgacg 
ctgccggtcg 
gacgcttaga 
ttttcaccag 
gcagcaagcg 
cgaaatcggc 



gttccggctg 
gctcgacgca 
cgataaacag 
cggccgacgt 
tgttcgggtc 
tgcgagatgc 
tcaaacagga 
agcccgaaca 
tattgctcgt 
tcctcggcgc 
tgccgggcgg 
ctgccgctct 
ctgcgggcgt 
cagcgggcct 
aacctcccgt 
tcgttccagt 
tcggcctggc 
ggatctcgcg 
gggtcgatca 
ccattcggtg 
gcgccactca 
tcaagatcga 
tctctgcgag 
acatgctacc 
ccgaatagca 
ccgtcccgga 

gggagctgtt 

caacttaata 
tgagacgggc 
gtccacgctg 
aaaatccctt 



ggggttcagc 
cttgcttcgc 
aggattaaaa 
gcaggatttc 
cgtttacgag 
cgtggcattc 
ggacggcccc 
gcgaggccga 
gatgatcgtc 
acttaatatt 
ggtcgcggcg 
gctaggtagc 
ggcgctgttg 
ggcgggggcg 
gcctctgctc 
agctttagtg 
gtggctcggc 
actcgaacct 
gccggggatg 
agcaatggat 
gcttcctcag 
cagcctgtca 
ggagatgata 
ctccgcgaga 
tcggtaacat 
ctgatgggct 
ggctggctgg 
acacattgcg 
aacagctgat 
gtttgcccca 
ataaatcaaa 
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agaatagccc gagatagggt tgagtgttgt tccagtttgg aacaagagtc cactattaaa 8760 
^ gaacgtggac tccaacgtca aagggcgaaa aaccgtctat cagggcgatg gcccactacg 8820 
r^^. '^^^''''^^''^ cccaaatcaa gttttttggg gtcgaggtgc cgtaaagcac taaatcggaa 8880 
ccctaaaggg agcccccgat ttagagcttg acggggaaag ccggcgaacg tggcgagaaa 8940 
ggaagggaag aaagcgaaag gagcgggcgc cattcaggct gcgcakctgt tgggaagggc 9000 
gatcggtgcg ggcctcttcg ctattacgcc agctggcgaa agggggatgt gctgcaaggc 9060 
gattaagttg ggtaacgcca gggttttccc agtcacgacg ttgtaaaacg acggccagtg 9120 
aattaattcc catcttgaaa gaaatatagt ttaaatattt attgataaaa taacaagtca 9180 
ggtattatag tccaagcaaa aacataaatt tattgatgca agtttaaatt cagaaatatt 9240 
tcaataacj:g attatatcag ctggtacatt gccgtagatg aaagactgag tgcgatatta 9300 
tgtgtaatac ataaattgat gatatagcta gcttagctca tcgggggatc cgtcgaagct 9360 
agcttgggtc ccgctoagaa gaactcgtca agaaggcgat agaaggcgat gcgctgcgaa 9420 
tcgggagcgg cgataccgta aagcacgagg aagcggtcag eccattcgcc gccaagctct 9480 
tcagoaatat cacgggtagc caacgctatg tcctgatago ggtccgccac acccagccgg 9540 
ccacagtcga tgaatccaga aaagcggcca ttttccacca tgatattcgg caagcaggca 9600 
tcgccatggg tcacgacgag atcctcgccg tcgggcatgc gcgccttgag cctggcgaac 9650 
agttcggctg gegcgagccc ctgatgctct tcgtccagat catcctgatc gacaagaccg 9720 
gcttccatcc gagtacgtgc tcgctcgatg cgatgtttcg cttggtggtc gaatgggcag 9780 
gtagccggat caagcgtatg cagccgccgc attgcatcag ccatgatgga tactttctcg 9840 
gcaggagcaa ggtgagatga caggagatcc tgccccggca cttcgcccaa tagcagccag 9900 
tcccttcccg cttcagtgac aacgtcgagc acagctgogc aaggaacgcc cgtcgtggcc 9960 
^ agccacgata gccgcgctgc ctcgtcctgc agttcattca gggcaccgga caggtcggtc 10020 
ttgacaaaaa gaaccgggcg cccotgcgct gacagccgga acacggcggc atcagagcag 10080 
ccgattgtct gttgtgccca gtcatagccg aatagcctct ccacccaagc ggccggagaa 10140 
50 cctgcgtgca atccatcttg ttcaatecaa gctcccatgg gccctcgact agagtcgaga 10200 
tctggattga gagtgaatat gagactctaa ttggataccg aggggaattt atggaacgtc 10260 
agtggagcat ttttgacaag aaatatttgc tagctgatag tgaccttagg cgacttttga 10320 
acgcgcaata atggtttctg acgtatgtgc ttagctcatt aaactccaga aacccgcgge 10380 
tgag€ggctc cttcaacgtt gcggttctgt cagttccaaa cgtaaaacgg cttgtcccgc 10440 
60 gtcatcggcg ggggtcataa cgtgactccc ttaattctcc gctcatgatc ttgatcccct 10500 
gcgccatcag atccttggcg gcaagaaagc catccagttt actttgcagg gcttcccaac 10560 
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cttaccagag ggcgccccag ctggcaattc cggttcgctt gctgtccata aaaccgccca 10620 
g gtctagctat cgccatgtaa gcccactgca agctacctgc tttctctttg cgcttgcgtt 10680 
cagatagccc agtagctgac attcatccgg ggtcagcacc gtttctgcgg 10740 
actggctttc tacgtgttcc gcttccttta gcagoccttg cgccctgagt gcttgcggca 10800 
gcgtgaagct tgcatgcctg caggtcgacg gcgcgccgag ctcctcgagc aaatttacac 10860 
attgccacta aacgtctaaa cccttgtaat ttgtttttgt tttactatgt gtgttatgta 10920 
tttgatttgc gataaatttt tatatttggt actaaattta taacaccttt tatgctaacg 10980 
tttgccaaca cttagcaatt tgcaagttga ttaattgatt ctaaattatt tttgtcttct 11040 
aaatacatat actaatcaac tggaaatgta aatatttgct aatatttcta ctataggaga llloo 
attaaag^ga gtgaatatgg taccacaagg tttggagatt taattgttgc aatgctgcat 11160 
ggatggcata tacaccaaac attcaataat tcttgaggat aataatggta coacacaaga 11220 
^ tttgaggtgc atgaacgtca cgtggacaaa aggtttagta atttttcaag acaacaatgt 11280 
taccacacac aagttttgag gtgcatgcat ggatgocctg tggaaagttt aaaaatattt 11340 
tggaaktgat ttgcatggaa gccatgtgta aaaccatgac atccacttgg aggatgcaat 11400 
aatgaagaaa actacaaatt tacatgcaac tagttatgca tgtagtctat ataatgagga 11460 
ttttgcaata ctttcattca tacacactca ctaagtttta cacgattata atttcttcat 11520 
^ agccagccca ccgcggtggg cggccgcctg cagtctagaa ggcctcctgc tttaatgaga 11580 
tatgcgagac gcctatgatc gcatgatatt tgctttcaat tctgttgtgc acgttgtaaa 11640 
aaacctgagc atgtgtagct cagatcctta ccgccggttt cggttcattc taatgaatat 11700 
atcacccgtt actatcgtat ttttatgaat aatattctcc gttcaattta ctgattgtcc 11760 
gtcgagcaaa tttacacatt gccactaaac gtctaaaccc ttgtaatttg tttttgtttt 11820 
^ actatgtgtg ttatgtattt gatttgcgat aaatttttat atttggtact aaatttataa 11880 
caccttttat gctaacgttt gccaacactt agcaatttgc aagttgatta attgattcta 11940 
aattattttt gtcttctaaa tacatatact aatcaactgg aaatgtaaat atttgctaat 12000 
atttctacta taggagaatt aaagtgagtg aatatggtac cacaaggttt ggagatttaa 12060 
ttgttgcaat gctgcatgga tggcatatac accaaacatt caataattct tgaggataat 12120 
^ aatggtacca cacaagattt gaggtgcatg aacgtcacgt ggacaaaagg tttagtaatt 12180 
^ tttcaagaca acaatgttac cacacacaag ttttgaggtg catgcatgga tgccctgtgg 12240 
aa^gfcttaaa aatattttgg aaatgatttg catggaagcc atgtgtaaaa ccatgacatc 12300 
60 cacttggagg atgcaataat Saagaaaact acaaatttac atgcaactag ttatgcatgt 12360 
agtctatata atgaggattt tgcaatactt tcattcatac acactcacta agttttacac 12420 



40 



50 
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gattataatt tcttcatagc cagcggatcc gatatcgggc ccgctagcgt taaccctgct 12480 

ttaatgagat atgcgagacg cetatgatcg catgatattt gctttcaatt ctgttgtgca 12540 

^ -egttgtaaaa aacctgagca t^gtagctc agatccttac cgccggtttc ggttcattct 12600 

aatgaatata tcacccgtta ctatcgtatt tttatgaata atattctccg ttoaatttac 12660 

tgattgtccg tcgacgaatt cgagctcggc gcgcctctag aggatcgatg aattcagatc 12720 

ggctgagtgg ctccttcaac gttgcggttc tgtcagttcc aaacgtalaaa cggcttgtcc 12780 

cgcgtcatcg gcgggggtca taacgtgact cccttaattc tccgotcatg atoagattgt 12840 

cgtttcccgc cttcagttta aactatcagt gtttgacagg atatattggc gggtaaacct 12900 

aagagaaaag agcgtttatt agaataatcg gatatttaaa agggcgtgaa aaggtttatc 12960 

cttcgtccat ttgtatgtgc atgccaacca cagggttccc ca 13002 

<210> I 31 
<211> 13905 
<212> DNA 

<213> artificial sequence 
<220>' 

lt±^lii^attiS"'^^^^°^^^^^°'' '^^^ Promotor-Terniinator-Expre 
<400> 31 

gatctggcgc cggccagcga gacgagcaag attggccgcc gcccgaaacg atccgacagc 60 

gcgcccagca caggtgcgca ggcaaattgc accaacgcat acagcgccag cagaatgcca 120 

tagtgggcgg tgacgtcgtt cgagtgaacc agatcgcgca ggaggcccgg cagcaccggc ISO 

ataatcaggc cgatgccgac agcgtcgagc gcgacagtgc tcagaattac gatcaggggt 240 

atgttgggtt tcacgtctgg cctccggacc agcctccgct ggtccgattg aacgcgcgga 300 

ttctttatca ctgataagtt ggtggacata ttatgtttat cagtgataaa gtgtcaagca 360 

tgaoaaagtt gcagccgaat acagtgatcc gtgccgccct ggacctgttg aacgaggtcg 420 

gcgtagacgg tctgacgaca cgcaaactgg cggaacggtt gggggttcag cagccggcgc 480 

tttactggca cttcaggaac aagcgggcgc tgctcgacgc actggccgaa gccatgctgg 540 

cggagaatca tacgcattcg gtgccgagag ccgacgacga ctggcgctca tttctgatcg 600 

ggaatgccog cagcttcagg caggcgctgc tcgcctacog cgatggcgcg cgcatccatg 660 

ocggcacgcg accgggcgca ccgoagatgg aaacggccga cgcgcagctt cgcttcctct 720 

gcqaggcggg tttttcggcc ggggacgccg tcaatgcgct gatgacaate agctacttca 780 

ctgttggggc ogtgcttgag gagcaggccg gcgacagcga tgccggcgag cgcggcggca 840 

ccgttgaaca ggctccgctc tcgccgctgt tgcgggccgc gatagacgcc ttcgacgaag 900 
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ccggtccgga 
ggaggctcgt 
tgccggagcg 
ccacc^cgtc 
ccaagcctca 
gctcactgac 
ggcggtaata 
aggccagcaa 
ccgcccccct 
aggactataa 
gaccctgccg 
ccgctgjcata 
tcgcacgata 
ggcgtcagcc 
ctgtccctta 
ctaccgccgg 
agergcagccc 
aggcggcggc 
aaatcacggg 
tgggccgcct 
tcggtgatgc 
gcaaggtcat 
aacggccggg 
gacttcgcgg 
gacgctcacc 
cgcgccagaa 
cctcgcggaa 
cgactcaccc 

ga^ctggcca 

**»'■ 

gatgtggaca 
tgacagatga 



cgcagcgttc 
tgtcaggaac 
caacccactc 
agacgcccgt 
cggccgcgct 
tcgctgcgct 
cggttatcca 
aaggccagga 
gacgagcatc 
agataccagg 
cttaccggat 
accctgcttc 
tacaggattt 
gggcaggata 
ttcgcacctg 
cgtaacagat 
acctaticaag 
ggccggcatg 
cgtcgtggac 
gggcggcctg 
cacgatcctc 
gatgggcgtg 

gggtgcgcgt 

agctggtgaa 

gggctggttg 

acgccgtcga 
aacttggccc 
ggcgcggcgt 
gcctcgcaaa 
agcctgggga 
ggggcgcgat 
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gagcagggac tcgcggtgat 
gttgaaggac cgagaaaggg 
actacagcag agccatgtag 
agcagcccgc tacgggcttt 
cggcctctct ggcggccttc 
cggtcgttcg gctgcggcga 
cagaatcagg ggataacgca 
accgtaaaaa ggccgcgttg 
acaaaaatcg acgctcaagt 
cgtttccccc tggaagctcc 
acctgtccgc ctttctccct 
ggggtcatta tagcgatttt 
tgccaaaggg ttcgtgtaga 
ggtgaagtag gccca'cccgc 
gcggtgctca acgggaatcc 
gagggcaagc ggatggctga 
gtgtactgcc ttccagacga 
agcctgtcgg cctacctgct 
tatgagcacg tccgcgagct 
ctgaaactct ggctcaccga 
gccctgctgg cgaagatcga 
gtccgcccga gggcagagcc 
gattgccaag cacgtcccca 
gtacatcacc gacgagcaag 
ccctcgccgc tgggctggcg 
agccgtgtgc gagacaccgc 
tcactgacag atgaggggcg 
tgacagatga ggggcaggct 
tcggcgaaaa cgcctgattt 
taagtgccct gcggtattga 
ccttgacact tgaggggcag 
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tgtcgatgga 
tgacgattga 
acaacatccc 
ttcatgccct 
tggcgctctt 
gcggtatcag 
ggaaagaaca 
ctggcgtttt 
cagaggtggc 
ctcgtgcgct 
tcgggaagcg 
ttcggtatat 
ctttccttgg 
gagcgggtgt 
tgctctgcga 
tgaaaccaag 
acgeiagagcg 
ggccgtcggc 
ggcccgcatc 
cgacccgcgc 
agagaagcag 
atgacttttt 
tgcgctccat 
gcaagaccga 
gccgtctatg 
ggccgccggc 
gacgttgaca 
cgatttcggc 
tacgcgagtt 
cacttgaggg 
agtgctgaca 



ttggcgaaaa 
tcaggaccgc 
ctcccccttt 
gccctagcgt 
ccgcttcctc 
ctcactcaaa 
tgtgagcaaa 
tccataggct 
gaaacccgac 
ctcctgttcc 
tggcgctttt 
ccatcctttt 
tgtatccaac 
tccttcttca 
ggctggccgg 
ccaaccagga 
attgaggaaa 
cagggctaca 
aatggcgacc 
acggcgcggt 
gacgagcttg 
tagccgctaa 
caagaagagc 
gcgcctttgc 
gccctgcaaa 
gttgtggata 
cttgaggggc 
cggcgacgtg 
tcccacagat 
gcgcgactac 
gatgaggggc 



960 
1020 
1080 
1140 
1200 
1260 
1320 
1380 
1440 
1500 
1560 
1620 
1680 
1740 
1800 
1860 
1920 
1980 
2040 
2100 
2160 
2220 
2280 
2340 
2400 
2460 
2520 
2580 
2640 
2700 
2760 
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gcacctattg 
ccgcccgttt 
5 aaaccttgtt 
tgcccCccct 
tgcgcccctc 
ttgccgggat 
ttgacgtgcc 
gcggcctggg 
• cggig-gccggc 
tgttcggggg 
, gtatgaaaac 
Gtacca|agac 
tactgataag 
ggcaaggcat 
tgcatggact 
attgggtaat 
tgtcatgcag 
gctgcctcag 
gcagctttcc 
cgtcaaaggg 
atacgtgcgc 
gcgatttagc 
tgcccggctg 
cgtgttgagg 
catatcaatg 
ccatgtttta 
acgcaccacc 
agcacctcaa 
tggtttcaaa 
aaaagctgtt 
cttgttataa 



acatttgagg 
ttcggccacc 
tttaaccagg 
tctcgaaccc 
ggccgcgaac 
cggggcagta 
gcaggtgctg 
tggcggcctg 
aattttfcacc 
tgcgataaac 
gagaattgga 
gaagaggatg 
ataatatatc 
aggcagcgcg 
aatgcttgaa 
gactccaact 
ctccaccgat 
attcaggtta 
cttcaggcgg 
tgacagcagg 
aacaaccgtc 
cccgacatag 
tatgcgcgag 
ccaacgccca 
attttctggt 
cggcagtgag 
ccgtcagtag 
aaacaccatc 
atcggctccg 
ttctggtatt 
ttagcttctt 
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ggctgtccac aggcagaaaa 
gctaacctgt cttttaacct 
gctgcgccct gtgcgcgtga 
tcccggcccg ctaacgcggg 
ggcctcaccc caaaaatggc 
acgggatggg cgatcagccc 
gcatcgacat tcagcgacca 
cccttcactt cggccgtcgg 
ttgggcattc ttggcatagt 
ccagcgaacc atttgaggtg 
cctttacaga attactctat 
aagaggatga ggaggcagat 
ttttatatag aagatatcgc 
cttatcaata tatctataga 
acccaggaca ataaccttat 
tattgatagt gttttatgtt 
tttgagaacg acagcgactt 
tgccgctcaa ttcgctgcgt 
gattcataca gcggccagcc 
ctcataagac gccccagcgt 
ttccggagac tgtcatacgc 
ccccactgtt cgtccatttc 
gttaccgact gcggcctgag 
taatgcgggc tgttgcccgg 
gcgtaccggg ttgagaagcg 
agcagagata gcgctgatgt 
ctgaacagga gggacagctg 
atacactaaa tcagtaagtt 
tcgatactat gttatacgcc 
taaggtttta gaatgcaagg 
ggggtatctt taaatactgt 
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tccagcattt 
gcttttaaac 
ccgcgcacgc 
cctcccatcc 
agcgctggca 
gagcgcgacg 
ggtgccgggc 
ggcattcacg 
ggtcgcgggt 
ataggtaaga 
gaagcgccat 
tgccttgaat 
cgtatgtaag 
atgggcaaag 
agcttgtaaa 
cagataatgc 
ccgtcccagc 
atatcgcttg 
atccgtcatc 
cgccatagtg 
gtaaaacagc 
cgcgcagacg 
ttttttaagt 
catccaacgc 
gtgtaagtga 
ccggcggtgc 
atagacacag 
ggcagcatca 
aactttgaaa 
aacagtgaat 
agaaaagagg 



gcaagggttt 
caatatttat 
cgaagg^ggg 
ccccaggggc 
gtccttgcca 
cccggaagca 
agtgagggcg 
gacttcatgg 
gccgtgctcg 
ttataccgag 
atttaaaaag 
atattgacaa 
gatttcaggg 
cataaaaact 
ttctatcata 
ccgatgactt 
cgtgccaggt 
ctgattacgt 
catatcacca 
cgttcaccga 
cagcgctggc 
atgacgtcac 
gacgtaaaat 
cattcatggc 
actgcagttg 
ttttgccgtt 
aagccactgg 
cccataattg 
acaactttga 
tggagttcgt 
aaggaaataa 



2820 

2880 

2940 

3000 

3060 

3120 

3180 

3240 

3300 

3360 

3420 

3480 

3540 

3600 

3660 

3720 

3780 

3840 

3900 

3960 

4020 

4080 

4140 

4200 

4260 

4320 

4380 

4440 

4500 

4560 

4620 
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taaatggcta aaatgagaat atcaccggaa ttgaaaaaac tgatcgaaaa ataccgctgc 4680 
gtaaaagata cggaaggaat gtctcctgct aaggtatata agctggtggg agaaaatgaa 4740 
5 aacctatatt taaaaatgac ggacagccgg tataaaggga ccacctatga tgtggaacgg 4800 
gaaaaffgaca tgatgctatg gctggaagga aagctgcctg ttccaaaggt cctgcacttt 4860 
gaacggcatg atggctggag caatctgctc atgagtgagg ccgatggcgt cctttgctcg 4920 
gaagagtatg aagatgaaca aagccctgaa aagattatcg agctgtatgc ggagtgcatc 4980 
aggctctttc actccatcga catatcggat tgtccctata cgaatagctt agacagccgc 5040 
ttagccgaat tggattactt actgaataac gatctggccg atgtggattg cgaaaactgg 5100 
gaagaagaca ctccatttaa agatccgcgc gagotgtatg attttttaaa gacggaaaag 5160 
cccgaagagg aacttgtctt ttcccacggc gacctgggag acagcaacat ctttgtgaaa 5220 

gggagaagcg gcagggcgga caagtggtat 5280 
gacattlgcct tctgcgtccg gtcgatcagg gaggatatcg gggaagaaca gtatgtcgag 5340 
ctattttttg acttactggg gatcaagcct gattgggaga aaataaaata ttatatttta 5400 
ctgga.tgaat tgttttagta ccfcagatgtg gcgcaacgat gccggcgaca agcaggagcg 5460 

caccgacttc ttccgcatca agtgttttgg ctctcaggcc ' gaggcccacg gcaagtattt 5520 

gggcaagggg tcgctggtat tcgtgcaggg caagattcgg aataccaagt acgagaagga 5580 

cggccagacg gtctacggga ccgacttcat tgccgataag gtggattatc t&gacaccaa 5640 

ggcaccaggc gggtcaaatc aggaataagg gcacattgcc ccggcgtgag tcggggcaat 5700 

cccgcaagga gggtgaatga atcggacgtt tgaccggaag gcatacaggc aagaactgat 5760 

cgacgcgggg ttttccgccg aggatgccga aaccatcgca agccgcaccg tcatgcgtgc 5820 

gccccgcgaa accttccagt cegtcggcte gatggtccag caagctacgg ccaagatcga 5880 

gcgcgacagc gtgcaactgg ctccccctgc cctgcccgcg ccatcggccg ccgtggagcg 5940 

ttcgcgtcgt ctcgaacagg aggcggcagg tttggcgaag tcgatgacca tcgapacgcg 6000 

aggaactatg acgaccaaga agcgaaaaae cgccggcgag gacctggcaa aacaggtcag 6060 

cgaggccaag caggccgcgt tgctgaaaca cacgaagcag cagatcaagg aaatgcagct 6120 

ttccttgttc gatattgcgc cgtggccgga cacgatgcg;a gcgatgccaa acgacacggc 6180 

ccgctctgcc ctgttcacca cgcgcaacaa gaaaatcccg cgcgaggcgc tgcaaaaoaa 6240 

ggtcattttc caogtcaaca aggacgtgaa gatcacctac accggcgtcg agctgcgggc 6300 

cg^cgatgac gaactggtgt ggcagcaggt gttggagtac gcgaagcgca cccctatcgg 6360 

cgagccgatc accttcacgt tctacgagct ttgocaggac ctgggctggt cgatcaatgg 6420 

ccggtattac acgaaggccg aggaatgcct gtcgcgccta caggcgacgg cgatgggctt 6480 
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cacgtccgac 
ggaccgtggc 
gtttgctggc 
ggccc^acgg 
eiaccttccgc 
cggcgaagcc 
tgacctggtg 
agccagcgct 
tcagtatcgc 
ttgacaattg 
cgcgagatcc 
cacgagfgaga 
ggcgcctaca 
aaggapgctc 

ggggtcgccg 

cgacagattc 
tcgctattct 
acggtaggcg 
ccgatacgat 
gtgttgacac 
gtttccatgg 
acctttaccg 
tttgatccgc 
ctgatcggag 
acagttgttt 
catcaggccg 
agerggagttg 
cggctttatc 



cggttaagcg 
tttgatcaca 
tcatccgtgt 



cgcgttgggc 
aagaaaacgt 
gaccactaca 
atgttcgact 
ctcatgtgcg 
tgcgaagagt 
cattgcaaac 
ttactggcat 
tcgggacgca 
tgattaaggc 
gattgtcggc 
aaaagcccat 
tcgacggcga 
acaaggcgca 
gtatgctgct 
caacgggaat 
ggagcttgtt 
ctgtgcagcc 
tgatggcggt 
caaacgcagc 
cgttcggaac 
cctggcaact 
caatcccgat 
cgggtttaac 
ccttactggg 
acagtcggaa 
atatcgtqaa 
cagcgatttc 
agaaatgaat 
ggcagcaacg 
ttcaaacccg 
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acctggaatc ggtgtcgctg 
cccgttgcca ggtcctgatc 
cgaaattcat atgggagaag 
atttcagctc gcaccgggag 
gatcggattc cacccgcgtg 
tgcgaggcag cggcctggtg 
gctagggcct tgtggggtca 
ttcaggaaca agcgggcact 
cggcgcgctc tacgaactgc 
tcagattcga cggcttggag 
cctgaagaaa gctccagaga 
gffaggcgttc gctgaacggt 
gatcattggg ctgtcggtct 
tcbgtccggc gttttcgtgg 
gcgggcgttg ccggcgggtt 
ctggtggatg cgcatcttca 
gtttatttcg gtctaccgcc 
gctgatggtc gtgttcatct 
cctgggggct atttgcggaa 
gctagatcct gtcggcgtcg 
cgtgctgacc cgcaagtggc 
ggcggccgga ggacttctgc 
gcctacagga accaatgttc 
ctacttcctt tggttccggg 
ctttctcagc cccagatctg 
cttcgggtcc ccgacctgta 
cgttcacttc taaagaaata 
ctattatgtc ggcatagttc 
aagaaggctg ataattcgga 
ctctgtcatc gttacaatca 
gcagcttagt tgccgttctt 
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ctgcaccgct 
gacgaggaaa 
taccgcaagc 
ccgtacccgc 
aagaagtggc 
gaacacgcct 
gttccggctg 
gctcgacgca 
cgataaacag 
cggccgacgt 
tgttcgggtc 
tgcgagatgc 
tcaaacagga 
agcccgaaca 
tattgctcgt 
tcctcggcgc 
tgccgggcgg 
ctgccgctct 
ctgcgggcgt 
cagcgggcct 
aacctcccgt 
tcgttccagt 
tcggcctggc 
ggatctcgcg 
gggtcgatca 
ccattcggtg 
gcgccactca 
tcaagatcga 
tctctgcgag 
acatgctacc 
ccgaatagca 



tccgcgtcct 
tcgtcgtgct 
tgtcgccgac 
tcaagctgga 
gcgagcaggt 
gggtcaatga 
ggggttcagc 

cttgcttcgc 
aggattaaaa 
gcaggatttc 
cgtttacgag 
cgtggcattc 
ggacggcccc 
gcgaggccga 
gatgatcgtc 
acttaatatt 
ggtcgcggcg 
gctaggtagc 
ggcgctgttg 
ggcgggggcg 
gcctctgctc 
agctttagtg 
gtggctcggc 
actcgaacct 
gccggggatg 
agcaatggat 
gcttcctcag 
cagcctgtca 
ggagatgata 
ctccgcgaga 
tcggtaacat 



6540 
-6600 
6660 
6720 
6780 
6840 
6900 
6960 
7020 
7080 
7140 
7200 
7260 
7320 
7380 
7440 
7500 
7560 
7620 
7680 
7740 
7800 
7860 
7920 
7980 
8040 
8100 
8160 
8220 • 
8280 
8340 
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gagcaaagtc 
gcctgtatcg 
tggcaggata 
gacgttttta 
tgcccttcac 
gcaggcgaaa 
agaatagccc 
gaacgtggac 
tgaaccatca 
ccctaaaggg 
ggaagggaag 
gatcgsftgcg 
gattaagttg 
aatta^attcc 
ggtattatag 
tcaataactg 
tgtgtaatac 
agcttgggtc 
tcgggagcgg 
tcagcaatat 
ccacagtcga 
tcgccatggg 
agttcggctg 
gcttccatcc 
gtagccggat 
gcaggagcaa 
tcccttcccg 
agccacgata 
ttgacaaaaa 
ccgattgtct 
cctgcgtgca 



tgccgcctta 
agtggtgatt 
tattgtggtg 
atgtactggg 
cgcctggccc 
atcctgtttg 
gagatagggt 
tccaacgtca 
cccaaatcaa 
agcccccgat 
aaagcgaaag 
ggcctcttcg 
ggtaacgcca 
catcttgaaa 
tccaagcaaa 
attatatcag 
ataaattgat 
ccgctcagaa 
cgataccgta 
cacgggtagc 
tgaatccaga 
tcacgacgag 
gcgcgagccc 
gagtacgtgc 
caagcgtatg 
ggtgagatga 
cttcagtgac 
gccgegctgc 
gaaccgggcg 
gttgtgccca 
atccatcttg 
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caacggctct cccgctgacg 
ttgtgccgag ctgccggtcg 
taaacaaatt gacgcttaga 
gtggtttttc ttttcaccag 
tgagagagtt gcagcaagcg 
atggtggttc cgaaatcggc 
tgagtgttgt tccagtttgg 
aagggcgaaa aaccgtctat 
gttttttggg gtcgaggtgc 
ttagagcttg acggggaaag 
gagcgggcgc cattcaggct 
ctattacgcc agctggcgaa 
gggttttccc agtcacgacg 
gaaatatagt ttaaatattt 
aacataaatt tattgatgca 
ctggtacatt gccgtagatg 
gatatagcta gcttagctca 
gaactcgtca agaaggcgat 
aagcacgagg aagcggtcag 
caacgctatg tcctgatagc 
aaagcggcca ttttccacca 
atcctcgccg tcgggcatgc 
ctgatgctct tcgtccagat 
tcgctcgatg cgatgtttcg 
cagccgccgc attgcatcag 
caggagatcc tgccccggca 
aacgtcgagc acagctgcgc 
ctcgtcctgc agttcattca 
cccctgcgct gacagccgga 
gtcatagccg aatagcctct 
ttcaatccaa gctcccatgg 
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ccgtcccgga 
gggagctgtt 
caacttaata 
tgagacgggc 
gtccacgctg 
aaaatccctt 
aacaagagtc 
cagggcgatg 
cgtaaagcac 
ccggcgaacg 
gcgcaactgt 
agggggatgt 
ttgtaaaacg 
attgataaaa 
agtttaaatt 
aaagactgag 
tcgggggatc 
agaaggcgat 
cccattcgcc 
ggtccgccac 
tgatattcgg 
gcgccttgag 
catcctgatc 
cttggtggtc 
ccatgatgga 
cttcgcccaa 
aaggaacgcc 
gggcaccgga 
acacggcggc 
ccacccaagc 
gccctcgact 



ctgatgggct 
ggctggctgg 
acacat'tgcg 
aacagctgat 
gtttgcccca 
ataaatcaaa 
cactattaaa 
gcccactacg 
taaatcggaa 
tggcgagaaa 
tgggaagggc 
gctgcaaggc 
acggccagtg 
taacaagtca 
cagaaatatt 
tgcgatatta 
cgtcgaagct 
gcgctgcgaa 
gccaagctct 
acccagccgg 
caagcaggca 
cctggcgaac 
gacaagaccg 
gaatgggcag 
tactttctcg 
tagcagccag 
cgtcgtggcc 
cagcrtcggtc 
atcagagcag 
ggccggagaa 
agagtcgaga 



8400 
8460 
8520 
8580 
8640 
8700 
8760 
8820 
8880 
8940 
9000 
9060 
9120 
9180 
9240 
9300 
9360 
9420 
9480 
9540 
9600 
9660 
9720 
9780 
9840 
9900 
9960 
10020 
10080 
10140 
10200 
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tctggattga gagtgaatat gagactctaa ttggataceg. aggggaattt atggaacgtc 10260 
agtggagcat ttttgacaag aaatatttgc tagctgatag tgaccttagg cgacttttga 10320 
5 acgcgoaata atggtttctg acgtatgtgc ttagotcatt aaactccaga aacccgcggc 10380 
tgagtcfectc cttcaacgtt gcggttctgt cagttccaaa cgtaaaacgg cttgtcccgc 10440 
gtcatoggcg ggggtcataa cgtgactccc ttaattctcc gctcatgatc ttgatcccct 10500 
gcgcc^taag atccttggcg gcaagaaago catccagttt actttgcagg gcttcccaac 10560 
cttaccagag ggcgccccag ctggcaattc cggttcgctt gctgtccata aaaccgccca 10620 
15 gtctagctat cgccatgtaa gcccactgca agctacctgc tttctctttg cgcttgcgtt 10680 
ttcccttgtc cagatagccc agtagctgac attcatccgg ggtcagcacc gtttctgcgg 10740 
actggctttc tacgtgttcc gcttccttta gcagcccttg cgccctgagt gcttgcggca 10800 
gcgtgaagct tgcatgcctg caggtcgacg gcgcgccgag ctjcctcgagc aaatttacac 10860 
attgccActa aacgtctaaa cccttgtaat ttgtttttgt tttactatgt gtgttatgta 10920 
25 tttgatttgc gataaatttt tatatttggt actaaattta taaeaccttt tatgctaacg 10980 
tttgccaaca cttagcaatt tgcaagttga ttaattgatt ctaaattatt tttgtcttct 11040 
^ aaatacatat actaatcaac tggaaatgta aatatttgct aatatttcta ctataggaga 11100 
attaaagtga gtgaatatgg taccacaagg tttggagatt taattgttgc aatgctgcat 11160 
ggatggcata tacaccaaac attcaataat tcttgaggat aataatggta odacacaaga 11220 
35 tttgaggtgc atgaacgtca cgtggacaaa aggtttagta atttttcaag acaacaatgt 11280 
taccacacac aagttttgag gtgcatgcat ggatgccctg tggaaagttt aaaaatattt 11340 
^ tggaaatgat ttgcatggaa gccatgtgta aaaccatgae atccacttgg aggatgcaat 11400 
aatgaagaaa actacaaatt tacatgcaac tagttatgca tgtagtctat ataatgagga 11460 
ttttgoaata ctttcattca tacacactca ctaagtttta cacgattata atttcttcat 11520 
45 agccagccca ccgcggtggg cggccgcctg cagtctagaa ggcctcctgc tttaatgaga 11580 
tatgcgagac gcctatgatc gcatgatatt tgctttcaat tctgttgtgc acgttgtaaa 11640 
^ aaacctgagc atgtgtagct cagatcctta ccgccggttt cggttcattc taatgaatat 11700 
atoacocgtt actatcgtat ttttatgaat aatattctcc gttoaattta ctgattgtcc 11760 
gtcgagcaaa tttacacatt gceactaaao gtctaaaocc ttgtaatttg tttttgtttt 11820 
55 actatgtgtg ttatgtattt gatttgcgat aaatttttat atttggtact aaatttataa 11880 
caqcttttat gctaacgttt gccaacactt agcaatttgc aagttgatta attgattcta 11940 
^ aattattttt gtcttctaaa tacatatact aatcaactgg aaatgtaaat atttgctaat 12000 
atttctacta taggagaatt aaagtgagtg aatatggtac cacaaggttt ggagatttaa 12060 
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ttgttgcaat gctgcatgga tggcatatac accaaacatt caataattct tgaggataat 12120 
aatggtacca cacaagattt gaggtgcatg aacgtcacgt ggacaaaagg tttagtaatt 12180 
5 tttcaagaca acaatgttac cacacacaag ttttgaggtg catgcatgga tgccctgtgg 12240 
aaagtetaaa aatattttgg aaatgatttg catggaagcc atgtgtaaaa ecatgacatc 12300 
cacttggagg atgcaataat gaagaaaact acaaatttac atgcaactag ttatgcatgt 12360 
agtctatata atgaggattt tgcaatactt tcattcatac acactcacta agttttacac 12420 
gattataatt tcttcatagc cagcggatcc gatatcgggc ccgctagcgt taaccotgct 12480 
15 ttaatgagat atgcgagacg cctatgatcg catgatattt gctttcaatt ctgttgtgca 12540 
cgttgtaaaa aacctgkgca tgtgtagctc agatccttac cgccggtttc ggttcattct 12600 
aatgaatata tcacccgtta ctatcgtatt tttatgaata atattctccg ttcaatttac 12660 
tgattgtccg tcgagcaaat ttaoacattg ccactaaacg tctaaaccct tgtaatttgt 12720 
ttttgt»ttta otatgtgtgt tatgtatttg atttgcgata aatttttata tttggtacta 12780 
25 aatttataac accttttatg ctaacgtttg ccaacactta gcaatttgca agttgattaa 12840 
ttgattctaa attatttttg tcttctaaat acatatacta atcaactgga aatgtaaata 12900 
^ tttgctaata tttctactat aggagaatta aagtgagtga atatggtacc acaaggtttg 12960 
gagatttaat tgttgcaatg ctgcatggat ggcatataca ccaaacattc aataattctt 13020 
gaggataata atggtaccac acaagatttg aggtgcatga acgtcacgtg gacaaaaggt 13080 
35 ttagtaattt ttcaagacaa caatgttacc acacacaagt tttgaggtgc atgcatggat 13140 
gccctgtgga aagtttaaaa atattttgga aatgatttgc atggaagcca tgtgtaaaac 13200 
catgacatcc acttggagga tgcaataatg aagaaaacta caaatttaca tgcaactagt 13260 
tatgcatgta gtctatataa tgaggatttt gcaatacttt cattcataca cactcactaa 13320 
gttttaoacg attataattt cttcatagcc agcagatctg ccggcatcga tcccgggcca 13380 
45 tggcctgctt taatgagata tgcgagacgc ctatgatcgc atgatatttg ctttcaattc 13440 
tgttgtgcac gttgtaaaaa acctgagcat gtgtagctca gatccttacc gccggtttcg 13500 
gttcattcta atgaatatat capccgttac tatcgtattt ttatgaataa tattctccgt 13560 
tcaatttact gattgtccgt cgacgagctc ggcgcgccto tagaggatcg atgaattcag 13620 
atcggctgag tggctocttc aacgttgcgg ttctgtcagt tccaaacgta aaacggcttg 13680 
55^ tcccgcgtca tcggeggggg tcataacgtg actcccttaa ttctccgctc atgatcagat 13740 
tgtcgtttcc cgccttcagt ttaaactatc agtgtttgac aggatatatt ggcgggtaaa 13800 
^ cctaagagaa aagagcgttt attagaataa tcggatattt aaaagggcgt gaaaaggttt 13860 
atccttcgtc catttgtatg tgcatgccaa ccacagggtt cccca 13905 
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<210> 32 

<211> 1443 

<212> DNA 

<213> Phaeodactylum tricornutiim 

A <220>'* 

<221> CDS 

<222> (9).. (1442) 

<223> 



<400> 32 

gatctaaa atg ggc aaa gga ggg gac get egg gcc teg aag ggc tea aeg 50 

Met Gly Lys Gly Gly Asp Ala Arg Ala Ser Lys Gly Ser Thr 

^ . 5 10 

gcg get cgc aag ate agt tgg cag gaa gtc aag ace cac gcg tct eeg 98 
Ala Ala Arg Lys lie Ser Trp Gin Glu Val Lys Thr His Ala Ser Pro 
^5 r 20 25 30 

gag gad gee tgg ate att eae tec aat aag gte tae gac gtg tec aac 146 
Glu As!£> Ala Tzp He He His Ser Asn Lys Val Tyr Asp Val Ser Asn 
35 40 45 

tgg cac gaa cat ccc gga ggc gee gte att tte aeg cac gcc ggt gac 194 
Trp His Glu His Pro Gly Gly Ala: Val He Phe Thr His Ala Gly Asd 
50 55 60 

gac atg acg gac att tte got gcc ttt cac gca ccc gga teg cag teg 242 
ASP Met Olir Asp He Phe Ala Ala Phe His Ala Pro Gly Ser Gin Ser 
65 ^ 70 75 

etc atg aag aag tte tac att ggc gaa ttg etc ccg gaa ace ace ggc 290 
Leu Mfet Lys Lys Phe Tyr He Gly Glu Leu Leu Pro Glu Thr Thr Gly 
80 85 90 

aag gag- eeg eag caa ate gcc ttt gaa aag ggc tae cgc gat ctg cgc 338 
Lys Glu Pro Gin Gin He Ala Phe Glu Lys Gly IVr Arg Asp Leu Arg 
95 100 105 110 

tec aaa etc ate. atg atg ggc atg tte aag tec aac aag tgg tte tac 386 
Ser Lys Leu He Met Met Gly Mfet Phe Lys Ser Asn Lys Trp Phe Tyr 
115 120 125 

gtc tac aag tgc etc age aac atg gcc att tgg gee gcc gee tgt get 434 
Val Tyr Lys Cys Leu Ser Asn Met Ala He Trp Ala Ala Ala Cys Ala 
130 . 135 140 

f f^^ 11^ ^'^^ ^ *=tg gc<r age gcc gtc 482 

Leu Val Phe Tyr Ser Asp Arg Phe Trp Val. His Leu Ala Ser Ala Val 
145 150 155 

atg ctg gga aca tte ttt eag cag teg gga tgg ttg gca cac gac ttt 530 
Met Leu Gly Thr -Phe Phe Gin Gin Ser Gly Trp Leu Ala His Asp Phe 
160 165 170 

ctg ^rac cac cag gtc tte acc aag cgc aag cac ggg gat etc gga gga 578 
Leu Has His Gin Val Phe Thr Lys Arg Lys His Gly Asp Leu Gly Gly 
175 180 185 190 



etc ttt tgg ggg aac etc atg cag ggt tae tee gta cag tgg tgg asia 



626 
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Leu Phe Trp Gly Asn Leu Met Gin Gly Tyr Ser Val Gin Trp Trp tys 
195 200 205 

aac aag cac aac gga cac cac gcc gtc ccc aac etc cac tac tec tec 
, Asn Lys His Asn Gly His- His Ala Val Pro Asa Leu His cjs Ser Ser 

215 220 

^1 f?^ ^^'^ "^^^ acc atg ccc ctt etc 

Ala Val Ala Gin Asp Gly Asp Pro Asp lie Asp -Ehr Met Pro Leu Leu 
225 230 235 

^ ^'^^ *=*sr tct tac egg gaa etc oaa gee gac 

Ala Trp Ser Val Gin Gin Ala Gin Ser Tyr Arg Glu Leu Gin Ala Isp 
240 245 250 

gga aag gat teg ggt ttg gtc aag ttc atg ate cgt aac caa tec tac 
Gly Lys Asp Ser Gly Leu Val Lys Phe Met He Arg Asn Gin Ser Tyr 

260 265 270 

ttt tac^ttt ccc ate ttg ttg etc gee cge ctg teg tag tto aac oaa 
Phe Tyr Phe Pro He Leu Leu Leu Ala Arg Le? Se? T?? S JJn SI 
, 275 280 285 

tec ttc aag tgc gee ttt ggg ctt gga get gcg teg gag aac get get 914 
ser Phe Lys Cys Ala Phe Gly Leu Gly Ala Ala Ser Glu Asn Ala Sa 
290 295 300 

etc gaa etc aag gee aag ggt ctt eag tac ccc ctt ttg gaa aag get 
Leu Glu Leu Lys Ala Lys Gly Leu Gin Tyr Pro Leu Leu Glu Lys Ala 
305 310 33^5 

Iff, fl5 Zfl 1^1 f.^^ teg tee ggc ttt 

330 



Z? 7 " °" aca fftt teg tee aac ttt 

Gly lie Leu Leu His Tyr Ala Trp Met Leu Thr Val Ser Ser Sly Phe 
320 325 ' 

H?* "° "° S^°Sr tac ace gca ttt tac ttt eta ace gcg ace 

Gly Arg Phe Ser Phe Ala Tyr Thr Ala Phe Tyr Phe Leu Thr ila ThJ 

335 • 340 



345 350 



365 



674 



722 



770 



818 



866 



962 



1010 



1058 



gcg tec tgt gga ttc ttg etc gee att gtc ttt ggc etc ggc cac aac lios 
Ala ser Cys Gly Phe Leu Leu Ala He Val Phe liy Leu gS 
355 360 



^? 5 ? f?"" ^""'^ ttc tgg aag etc II54 

Gly Met Ala Ifer oyr Asn Ala Asp Ala Arg Pro Asp Phe tS LyJ Leu 

375 380 

fr*"? fif ^ ^^"^ ^^"^ <=ac ggt ttc ccc caa 

Gin Val l^r Thr Thr Arg Asn Val Thr Gly Gly His Gly Phe Pro Gin 
385 390 

f?"" IV" ^^"^ tac caa gtc gac cac 

Ala Phe Val Asp Trp Phe Cys Gly Gly Leu Gin Tyr Gin Val Asp His 
400 405 410 

cac tta .ttc ccc age ctg ccc cga cac aat ctg gcc aag aca cac gca 
Hi^ Leu Phe Pro Ser Leu Pro Arg His Asn Leu Ala Lys Thr His Ala 

420 425 430 



1202 



1250 



1298 



1346 
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gac ctt gtg gac ggg acc atg gaa gtc ttg oac cat ttg ggc age gtg 1304 
ASP Leu val Asp Gly Thr Met Glu Val Leu His His Leu §ly Ser ?al 
5 455 

gtg "gat ttt gta cgc gat gga ccc gcc atg taa a I443 
Ala Gly Glu Phe Val Val Asp Phe Val Arg Asp Gly Pro Ala Mfe? 
465 470 475 

10 

• <210> 33 
<211> 477 
<212> PRT 

<213> Phaeodaqtylum tricornutum 

15 

<400> 33 



20 



Mtet Gly Lys Gly Gly Asp Ala Arg Ala Ser Lys Gly Ser Thr Ala Ala 
1 5 10 



15 



25 



Arg Lys lie Ser Trp Gin Glu Val Lys Thr His Ala Ser Pro Glu Asn 
I 20 25 30 

Ala Trp lie lie His Ser Asn Lys Val Tyr Asp Val Ser Asn Trp His 
' 35 . 40 • 45 

30 Glu His Pro Gly Gly Ala Val He Phe Thr His Ala Gly Asp Asp Met 

55 60 

Thr Asp He Phe Ala Ala Phe His Ala Pro Gly Ser Gin Ser Leu Met 

70 75 30 

Lys Lys, Phe Tyr He Gly Glu Leu Leu Pro Glu Thr Thr Gly Lys Glu 
40 ®^ ^° 95 



45 



Pro Gin Gin lie Ala Phe Glu Lys Gly Tyr Arg Asp Leu Arg Ser Lys 
100 105 110 

Leu He Met Met Gly Met Phe Lys Ser Asa Lys Trp Phe Tyr Val Tvr 
115 120 



50 Lys Cys Leu Ser Asn Met- Ala He Trp Ala Ala Ala Cys-Ala Leu Val 
"0 135 140 

i>q f^f ^ Ala Ser Ala Val Met Leu 

''^ 145 ... 150 155 



160 



Gly Thr Phe Plie Gin Gin Ser Gly Trp Leu Ala His Asp Phe Leu His 
60 . "° 175 



His 



Gin Val Phe Thr Lys Arg Lys His Gly Asp Leu Gly Gly Leu Phe 
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180 
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190 



Trp Gly Asn Leu Met Gin Gly Tyr Ser Val Gin Trp Trp Lys Asn Lys 
5 195 . . ^ 200 205 

His Asn Gly His His Ala Val Pro Asn Leu His Cys Ser Ser Ala Val 
210 215 220 

* ^ ii 

Ala Gin Asp Gly Asp Pro Asp lie Asp Thr Met Pro Leii Leu Ala Tro 
225 230 235 240 



15 



Ser Val Gin Gin Ala Gin Ser Tyr Arg Glu Leu Gin Ala Asp Gly Lys 
245 250 255 



20 Asp Ser^Gly Leu Val Lys Phe Met lie Arg Asn Gin Ser Tyr Phe Tyr 
260 .265 270 

( 

Phe Pro He Leu Leu Leu Ala Arg Leu Ser Trp Leu Asn Glu Ser Phe 
-^O 275 280 285 

Lys Cys Ala Phe Gly Leu Gly Ala Ala Ser Glu Asn Ala Ala Leu Glu 
290 295 300 



35 



Leu Lys Ala Lys Gly Leu Gin Tyr Pro Leu Leu Glu Lys Ala Gly lie 
305 310 315 

Leu Leu His Tyr Ala Trp Met Leu Thr Val ser Ser Gly Phe Gly Ara 
325 330 335 



40 Phe Ser Phe Ala Tyr Thr Ala Phe Tyr Phe Leu Thr Ala Thr Ala Ser 
340 345 

Cys Gly Phe Leu Leu Ala lie Val Phe Gly Leu Gly His Asn Gly Ifet 
45 355 360 365 

Ala Thr Tyr Asn Ala Asp Ala Arg Pro Asp Phe Trp Lys Leu Gin Val 
5Q 370 375 380 

Thr Thr Thr Arg Asn Val Thr Gly Gly His Gly Phe Pro Gin Ala Phe 
. 390 395 400 

55 

Val Asp. Trp Phe Cys Gly Gly Leu Gin Tyr Gin Val Asp His His Leu 
< 410 415 

60 Phe Pro Ser Leu Pro Arg His Asn Leu Ala Lys Thr His Ala Leu Val 
420 425 430 
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Glu Ser Phe Cys Lys Glu Trp Gly Val Gin Tyr His Glu Ala Asp Leu 
435 440 445 

5 

'Val Asp Gly Thr Met Glu Val Leu His His Leu Gly Ser Val Ala Glv 
450 455 460 

10 Glu Phe Val Val Asp Phe Val Arg Asp Gly Pro Ala Met 
• 465 . . 470 ' 475 

<210> 34 
1'5 <211> 17061 
<212> DNA 

<213> Phaeodactylum tricomutum, Physcomitrella patens, Caenorhabditis 
elegans 

20 <220> 

<221> CDS 

<222> /{4554) . . (5987) 
<223> I 



25 



30 



40 



50 



<220> 
<221>, CDS 

<222> (2805) . . (3653) 
<223> 



<220> 
<221> CDS 

<222> (1026) : . (1898) 
35 <223> 



55 



60 
120 



<400> 34 

tggggaaccc tgtggttggc atgcacatac aaatggacga aggataaacc ttttcacgcc 
cttttaaata tccgattatt ctaataaacg ctcttttctc ttaggtttac ccgccaatat 
atcctgtcaa acactgatag tttaaactga aggcgggaaa cgacaatctg atcatgagcg 180 
45 gagaattaag ggagtcacgt tatgaccccc gccgatgacg cgggacaagc cgttttacgt 240 
ttggaactga cagaaccgca acgttgaagg agccactcag ccgatctgaa ttcatcgatc 300 
ctctagaggc gcgccgagct cctcgagcaa atttacacat tgccactaaa cgtctaaacc 360 
cttgtaattt gtttttgttt tactatgtgt gttatgtatt tgatttgcga taaattttta 420 
tatttggtac taaatttata acacctttta tgctaacgtt tgccaacact tagcaatttg 



480 



caagttgatt aattgattct aaattatttt tgtcttctaa atacatatac taatcaactg 540 

gaaatgtaaa tatttgctaa tatttctact ataggagaat taaagtgagt gaatatggta ' 600 

ccacaaggtt tggagattta attgttgcaa tgctgcatgg atggcatata caccaaacat 660 

tcaataattc ttgaggataa taatggtacc acacaagatt tgaggtgcat gaacgtcacg 720 
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tggacaaaag gtttagtaat ttttcaagac aacaatgtta ccacacacaa gttttgaggt 780 

gcatgcatgg atgccctgtg gaaagtttaa aaatattttg gaaatgattt gcatggaagc 840 

catgtgtaaa accatgacat ccacttggag gatgcaataa tgaagaaaac tacaaattta 

catgcEacta gttatgcatg tagtctatat aatgaggatt ttgoaatact ttcattcata 

cacactcact aagttttaca cgattataat ttcttcatag ccagcccacc gcggtgggcg 1020 

gccgc atg gag gtc gtg gag aga ttc tac ggt gag ttg gat ggg aag gtc 1070 
Met Glu Val Val Glu Arg Phe Tyr Gly Glu Leu Asp lly Ly? ?al 

1 5 in' 



5 



is 



30 



55 



5 .10 15 

teg cag ggc gtg aat gca ttg ctg ggt agt ttt ggg gtg gag tta acci 
sen Gla Gly Val Asn Ala Leu Leu Gly Ser Phe lly ial SS £eS 
20 25 30 

!>n ^"^^ *=tc gtt gac agt ccc aca ccc 116S 

20 ASP Thr,Pro Thr lOir Lys Gly Leu Pro Leu Val Asp Ser Pro ?S Pro 

. , -40 45 

ate gtic etc ggt gtt tct gta tac ttg act att gtc att gga ggg ott 1214 
He val Leu Gly Val Ser Val Tyr Leu Thx He Val He Sly lly LeJ 
50 55 60 

ttg tgg ata aag gee agg gat ctg aaa ccg cge gee teg gag cea ttt 12S2 
Leu Trp He Lys Ala Arg Asp Leu Lys Pro Arg Ala Se? lln til Phe 
°5 70 75 

ttg etc caa get ttg gtg ett gtg cac aac ctg ttc tgt ttt gcg etc 1310 
Leu Leu Gin Ala Leu Val Leu Val His Asn Leu Phe cjs Phe 111 Leu 
8° 85 90 95 



115 120 125 

att ctg gta tac ttg ttc tac atg tct aag. tac gtg gaa ttc attr cr-t- 
45 Ytl ^""^ ^ ^ 

135 140 



^ vll rll ^It T?^ r''^ f*^ *srg caa ata age ttc etc 

He Met He Leu Lys Arg Ser Thr Arg Gin He Ser Phe Leu 

50 . 155 

cac gtt tat cat cat tct tea att tec etc att tgg taa act att anf 
His val Tyr His His Ser Ser He Ser Leu He Ha Se Sa 

1^0 165 170 175 



900 
960 



1358 



f ^ 1^ ^''^ ^^"^ 9°*= tat cag get att ace tgg egg 

ser Leu Tyr Met Cys Val Gly He Ala Tyr Gin ila He Th? 

100 105 110 

An l"^ "^^^ aaa cat aaa gag atg gca 1406 

40 Tyr Ser Leu Trp Gly Asn Ala Tyr Asn Pro Lys His Lys llu Se? Sa 



1454 



1502 



1550 



cat cac get cct ggc ggt gaa gca tat tgg tct gcg get eta aac f-oa i^ao 
His His Ala Pro Gl^ Gly Glu Ala Tyr tS Ser til S LeS Sn Ser 
' V- ■ 185 190 

fin tat tac ttc ttg got gcc tgc ctt isafi 

60 Gly val His Val Leu Mfet Tyr Ala Tyr Tyr Phe LeG IS Sa C?s ill 

195 nf\n "* 
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c^a agt age cca aag tta aaa aat aag tac ctt ttt tgg ggc agg tac 
Arg Ser Ser Pro Lys Leu Lys Asn Lys Tyr Leu Phe Trp Gly Arg Tyr 
210 215 220 



PCT/EP2004/000771 
1694 



5 
10 



15 



20 



60 



ttg aca caa ttc caa atg .ttc cag ttt atg ctg aac tta gtg cag get 1742 
Leu Thr Gin Phe Gin Met Phe Gin Phe Met Leu Asn Leu Val Gin Ala 
225 230 235 

tac tac gac atg aaa acg aat gcg cca tat cca caa tgg ctg ate aag 179 o 
Tyr Tyr Asp Met Lys Thr Asn Ala Pro Tyr Pro Gin Trp Leu He Lvs 
240 . . .245 * ■ 250 255 

att ttg ttc tac tac atg ate teg ttg ctg ttt ctt ttc ggc aat ttt 1838 
He Leu Phe Tyr. Tyr Met He Ser Leu Leu Phe Leu Phe Gly Asn Phe 
260 265 270 

tac gta caa aaa tac ate aaa ccc tct gac gga aag caa aag gga get 1886 
Tyr Val Gin Lys Tyr He Lys Pro Ser Asp Gly Lys Gin Lys Gly Ala 
275 280 285 

Lys Th^ Glu tctagaaggc ctcctgcttt aatgagatat gcgagacgcc 1938 
I 290 



25 


tatgatcgca 


tgatatttgc 


tttcaattct gttgtgcacg 


ttgtaaaaaa 


cetgagcatg 


1998 




tgtagptcag atccttaccg ccggtttegg ttcattqtaa 


tgaatatate 


aeccgttaet 


2058 


30 


atcgtatttt 


tatgaataat 


attctcegtt caatttactg 


attgtcegtc 


gagcaaattt 


2118 




acacattgcc 


actaaacgtc 


taaacccttg taatttgttt 


ttgttttact 


atgtgtgtta 


2178 




tgtatttgat 


ttgcgataaa 


tttttatatt tggtactaaa 


tttataacac 


cttttatgct 


2238 


35 


aacgtttgcc 


aacacttagc aatttgcaag ttgattaatt 


gattctaaat 


tatttttgtc 


2298 




ttctaaatac 


atatactaat 


caactggaaa tgtaaatatt 


tgctaatatt 


tctactatag 


2358 


40 


gagaattaaa 


gtgagtgaat 


atggtaccac aaggtttgga gatttaattg 


ttgcaatgct 


2418 




gcatggatgg 


catatacacc 


aaacattcaa taattcttga 


ggataataat 


ggtaceacac 


2478 




aagatttgag gtgcatgaac 


gtcacgtgga caaaaggttt 


agtaattttt 


caagacaaca 


2538 


45 


atgttaccac 


acacaagttt 


tgaggtgcat gcatggatgc 


cctgtggaaa 


gtttaaaaat 


2598 




attttggaaa 


tgatttgcat 


ggaagccatg tgtaaaacca 


tgacatccac 


ttggaggatg 


2658 


50 


caataatgaa 


gaaaactaca aatttacatg caactagtta tgcatgtagt 


ctatataatg 


2718 




aggattttgc 


aatactttca 


ttcatacaca ctcactaagt 


tttacacgat 


tataatttct 


2778 


55 


tcatagccag cggatccgcc 


cacata atg gag aac ttc 
Met Glu Asn Phe 


tgg tct att gtt gtg 
Trp Ser He Val Val 
295 


2831 



1^ "° tat aac ata teg aca gta 2879 

Phe Phe Leu Leu Ser lie Leu Phe lie Leu Tyr Asn He Ser Thr Val 
300 305 310 315 

tgc cac tac tat atg egg att teg ttt tat tac ttc aca att tta ttg 2927 
Cys Hxs Tyr Tyr Met Arg He Ser Phe Tyr Tyr Phe Thr He Leu L6u 
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3023 



3071 



5^ %f « ? ^""Sr ate cct tct tgg eta aat ggg 2975 

His Gly Ifet Qlu val Cys Val Thr Mfet lie Pro Ser Trp Leu Asn Gly 
335 340 345 

aag gtrt get gat tac gtg ttt cac teg ttt ttc tat tgg tgt aaa tgg 
Lys Gly Ala Asp Tyr Val Phe His Ser Plie Phe Tyr Trp Cys Lys Trp 
350 355 360 

act ggt gtt cat aca aca gtc *tat gga tat gaa aaa aoa eaa gtt gaa 
•Sbr Gly Val His Thr Thr Val Tyr Gly Tyr Glu Lys Thr Gin Val Glu 
365 370 375 

ggt ccg get gta gtt att tgt aat eat cag agt tot etc gac att eta 3119 
Gly Pro Ala val Val He Cys Asn His Oln Ser Ser Leu Asp He Leu 
380 385 390 395 

teg atg gca tea ate tgg ccg aag aat tgt gtt gta atg atg aaa ega 3167 
ser Met^Ala Ser He Trp Pro Lys Asn Cys Val Val Met Met Lys Arg 
400 405 410 

att ctft gee tat gtt cea ttc ttc aat etc gga gee tac ttt tec aac 3215 
He Leu Ala Tyr Val Pro Phe Phe Asn Leu Gly Ala Tyr Phe Ser Asn 
^ 415 420 425 

^^'^ ^'^ff ^tg get tea gtt 

^^t ^-^^ ^ Glu Arg Ala Met Ala Ser Val 

.430 435 440 

^f® aat ctt aaa ctt tgg gta 

Asp lyr Cys Ala Ser Qlu Met Lys Asn Arg Asn Leu Lys Leu Trp Val 
445 450 455 

sr&^ ttc att oca ttc aag 3359 
Phe Pro Glu Gly Thr Arg Asn Arg Glu Gly Gly Phe He Pro Phe Lys 

465 470 475 

aaa gga gca ttc aat att gca gtt cgt geg cag att ecc att att cca 3407 
40 Lys Gly Ala Phe Asn He Ala Val Arg Ala Gin He Pro He He Pro 

480 485 490 

fr^f It" ""^^ '^^^ <^a° aag cca gge ega tat 

Val Val Phe Ser Asp Tyr Arg Asp Phe Tyr Ser Lys Pro Gly Arg Tvr 
495 500 505 

ttc aag aat gat gga gaa gtt gtt att ega gtt ctg gat gcg att cca 3503 
Phe Lys Asn Asp Gly Glu Val Val He Arg Val Leu Lp Ala He Pro 
510 515 520 

aca aaa ggg etc act ctt gat gac gtc age gag ttg tet gat atg tgt 3551 
Ifhx Lys Gly Leu Thr Leu Asp Asp Val Ser Glu Leu Ser Asp Met Cys 
525 530 535 



3263 



3311 



3455 



egg gac gtt atg- ttg gca gee tat aag gaa gtt act eta gaa get cag 3599 
Arg Asp val Met Leu Ala Ala Tyr Lys Glu Val Thr Leu Ilu Ila Gin 
54.0 545 • 550 555 



fin t ff* ^Sra gaa aca aaa gac ggg aag aaa tct 3647 

60 Gin Arg Asn Ala Thr Aifg Arg Gly Glu Thr Lys Asp Gly l.yl Lys SbI 

560 565 570 
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5 
10 



15 



20 



25 



30 



tgatatttgc tttcaattct gttgtgcacg ttgtaaaaaa cctgagcatg tgtagctcag 3763 

atcctttaccg ccggtttcgg tteattctaa tgaatatatc acccgttact atcgtatttt 3823 

tatgaataat attctccgtt caatttactg attgtccgtc gagcaaattt acacattgcc 3883 

actaaacgtc taaacccttg taattt&ttt ttgttttact atgtgtgtta tgtatttgat 3943 

ttgcgataaa tttttatatt tggtactaaa tttataacac cttttatgct aacgtttgcc 4003 

aacacttagc aatttgcaag ttgattaatt gattctaaat tatttttgtc ttctaaatac 4063 

atatactaat caactggaaa tgtaaatatt tgctaatatt tctactatag gagaattaaa 4123 

gtgagtgaat atggtaccac aaggtttgga gatttaattg ttgcaatgct gcatggatgg 4183 

qatatacacc aaacattcaa taattcttga ggataataat ggtaccacac aagatttgag 4243 

gtgcatgaac gtcacgtgga caaaaggttt agtaattttt caagacaaca atgttaccac 4303 

acacaagttt tgaggtgcat gcatggatgb cctgtggaaa gtttaaaaat attttggaaa 4363 

tgatttgeat ggaagccatg tgtaaaacca tgacatccac ttggaggatg caataatgaa 4423 

gaaaactaca aatttacatg caactagtta tgcatgtagt ctatataatg aggattttgc 4483 

aatactttca ttcatacaca ctcactaagt t-ttacacgat tataatttct tcatagccag 4543 

cagatctaaa atg ggc aaa gga ggg gac get egg gee teg aag gge tea 4592 
JXtet Gly Lys Gly Gly Asp Ala Arg Ala Ser Lys Gly Ser 
575 580 585 

acg gcg get cgc aag ate agt tgg eag gaa gtc aag ace cac gcg tct 4640 
- Thr Ala .Ala Arg Lys He Ser Trp Gin Glu Val Lys Thr His Ala Ser 
590 595 600 

ccg gag gac gcc tgg ate att cac tec aat aag gtc tac gac gtg tec 4688 
Pro Glu Asp Ala Trp He He His Ser Asn Lys Val Tyr Asp Val Ser 
605 610 615 

aac tgg cac gaa eat ece gga gge gee gtc att ttc acg cac gcc ggt 4736 
Asn Trp Has Glu His Pro Gly Gly Ala Val He Phe Thr His Ala Gly 
620 625 630 

gac gac atg acg gac att ttc get gcc ttt cac gca ccc gga tog eag 4784 
Asp Asp Met Thr Asp He- Phe Ala Ala Phe His Ala Pro- Gly Ser Gin 
635 640 645 

teg etc atg aag aag. ttc tac att ggc gaa ttg etc ccg gaa ace acc 4832 
Ser Leu Met Lys Lys Phe Tyr He Gly Glu Leu Leu Pro Glu Thr Thr 
650 655 660 665 

ggc aag gag ccg cageaa ate gcc ttt gaa aag ggc tac cgc gat ctg 4880 
Gly IJSrs Glu Pro Gin Gin He Ala Phe Glu Lys Gly Tyr Arg Asp Leu 
670 675 680 

cgc tec aaa etc ate atg atg gge atg ttc aag tec aac aag tgg ttc 4928 
Arg Ser Lys Leu He Met Met Gly M6t Phe Lys Ser Asn Lys Trp Phe 
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685 690 



695 



tac gtc tac aag tgc etc age aac atg gcc att tgg gcc gee gcc tgt 4976 
Tyr Val Tyr Lys Cys Leu Ser Asn Met Ala lie Trp Ala Ala Ala Cys 



5 700 , 705 



710 



10 



15 



20 



30 



35 



40 



50 



55 



get etc gte ttt tac teg gac cge ttc tgg gta cac ctg gcc age gcc 5024 
Ala Leu Val Phe Tyr Ser Asp Arg Phe Trp Val His Leu Ala Ser Ala 
715 720 725 

fr^^ t^f H?* ^ ^5° ttS sea. cac gac ^ 5072 

Val Met Leu Gly Thr Phe Phe Gin Qln Ser Gly Trp Leu Ala His As© 
730 735 740 745 

ttt ctg cac cac cag gtc ttc acc aag cge aag cac ggg gat etc gga 5120 
Phe Leu His His Gin Val Phe Thr Lys Arg Lys His Gly Asp Leu Gly 



750 755 



760 



gga etc ttt tgg ggg aac etc atg cag ggt tac tee gta cag tgg tgg 5168- 
Gly Leu^Phe Trp Gly Asn Leu Met Gin Gly Tyr Ser Val Gin Trp Trp 
765 .770 775 

aaa aa|c aag cac aac gga cac cac gcc gtc ccc aac etc cac tgc tec- • 
Lys Asn Lys His Asn Gly His His Ala Val Pro Asn Leu His Cys Ser [. 



25 . . 780 785 



790 



795 800 



805 



tac ttt tac ttt ccc ate ttg ttg etc gcc cge ctg teg tgg ttg aac 
Tyr Phe Tyr Phe Pro lie Leu Leu Leu Ala Arg Leu Ser Trp Leu Asn 

850 855 

gag tec ttc aag tgc gcc ttt ggg ctt gg^ get gcg teg gag aac get 
Glu Ser Phe Lys Cys Ala Phe Gly Leu Gly Ala Ala Ser Glu Asn Ala 
45 860 865 870 



905 



ttt gga egc ttc- teg ttc gcg tac acc gca ttt tac ttt eta acc gcg 
r.^. Phe Gly .Arg Phe Ser Phe Ala Tyr Thr Ala Phe Tyr Phe Leu Thr Ala 
« ^15 920 

acc gcg tec tgt gga ttc ttg etc gcc att gtc ttt ggc etc ggc cac 
DU Thr Ala Ser Cys Gly Phe Leu Leu Ala lie Val Phe Gly Leu Gly His 
^25 930 935 



5216/ 



tec g;ca gtc gcg caa gat ggg gac ccg gac ate gat acc atg ccc ctt 5264- 
Ser Ala Val Ala Gin Asp Gly Asp Pro Asp lie Asp Thr Met Pro Leu 



etc gcc tgg tec gtc cag caa gcc cag tct tac egg gaa etc caa gcc 5312 
Leu Ala Trp Ser Val Gin Gin Ala Gin Ser Tyr Arg Glu Leu Gin Ala ■ 
810 815 820 825 

gac gga aag gat teg ggt ttg gtc aag ttc atg ate cgt aac caa tec 5360 • 

Asp Gly Lys Asp Ser Gly Leu Val Lys Phe Met He Arg Asn Gin Ser 
830 835 840 



5408 



5456 



get etc gaa etc aag gcc aag ggt ctt cag tac ccc ctt ttg gaa aag 5504 
Ala Leu Glu Leu Lys Ala Lys Gly Leu Gin Tyr Pro Leu Leu Glu Lvs 
875 880 885 

»» 

get ggc ate ctg ctg cac tac get tgg atg ctt aca gtt teg tec ggc 5552 
Ala Gly He Leu Leu His Tyr Ala Trp Met Leu Thr Val Ser Ser Glv 
890 895 900 



5600 



5648 
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aac ggc atg gcc acc tac aat gcc gac gcc cgt ccg gac ttc tag aag 
Asn Gly Met Ala Thr Tyr Ala Asp Ala Arg Pro Asp Phe Trp Lys 
940 945 

5 . etc caa gtc acc acg act cgc aac gtc acg ggc gga cac ggt ttc ccc 
Leu Gin Val OMir Thr Thr Arg Asn Val Thr Gly Gly His Gly Phe Pro 
95B 960 965 

caa gcc ttt gtc gac tgg ttc tgt ggt ggc etc cag tac caa gtc gac 
O Gin Ala Phe Val Asp Trp Phe Cys Gly Gly Leu Gin riyr Gin Val Asp 
970 . . 975 * 980 985 



5 



0 



cac cae tta ttc ccc age ctg ccc cga cac aat etg gcc aag aca cac 
His His Leu Phe Pro Ser Leu Pro Arg His Asn Leu Ala Lys Thr His 
990 995 1000 



gca ctg gtc gaa 
Ala Leu Val Glu 
1005 

/- 

gaa gcc gac ctt 
Glu Ala' Asp Leu 
I 1020 



teg ttc tgc aag gag ■ 
Ser Phe Cys Lys Glu 
1010 

gtg gac ggg acc- atg 
Val Asp Gly Thr Met 
. 1025 



tgg -ggt gtc cag tac cac 
Trp Gly Val Gin Tyr His 
1015 

gaa gtc .ttg cac cat ttg 
Glu Val Leu His His Leu 
1030 



ggc age gtg gcc ggc gaa ttc gtc gtg gat. ttt gta cgc gat gga 
Gly Ser Val Ala Gly Glu Phe Val Val Asp Phe Val Arg Asp Gly 
1035 1040 * 1045 

ccc gcc atg taa agatctgecg gcatcgatcc cgggccatgg cetgctttaa. • 
Pro Ala Met 



5696 



5744- 



5792 



5840' 



. 5885 



5930 



5975 



6027,- 



tgagatatgc 

gtaaaaaacc 

aatatatcac 

tgtecgtega 

aagcactcag 

aaacggtget 

agegcaaaga 

gttttatgga 

aagccetgea 

tcaagatcat 

caagccgttt 

ggtttctgga 

gtc;gcetaag 

*«** 

ccataaattc 
ctetagtega 



gagacgecta 

tgagcatgtg 

ccgttactat 

cgagctcggc 

ggcgeaaggg 

gaccceggat 

gaaagcaggt 

eagcaagcga 

aagtaaaetg 

gagcggagaa 

tacgtttgga 

gtttaatgag 

gtcactatca 

ccctcggtat 

gggcceatgg 



tgatcgcatg 

tagetcagat 

cgtattttta 

gcgcegtcga 

ctgctaaagg 

gaatgtcagc 

agcttgcagt 

accggaattg 

gatggetttc 

ttaagggagt 

actgacagaa 

ctaageaeat 

getagcaaat 

ccaattagag 

gagcttggat 



atatttgctt 

ccttacegce 

tgaataatat 

cctgcaggca 

aagcggaaca 

tactgggcta 

gggcttacat 

ccagetgggg 

ttgccgccaa 

eacgttatga 

ccgcaacgtt 

aegtcagaaa 

atttcttgtc 

tctcatatte 

tgaacaagat 



tcaattctgt 
ggtttcggtt 
tctccgttca 
tgeaagettc 
cgtagaaage 
tctggacaag 
ggcgatagct 
cgeectctgg 
ggatctgatg 
cccccgecga 
gaaggagcca 
ccattattgc 
aaaaatgcte 
actctcaatc 
ggattgcaeg 



tgtgcacgtt 

cattctaatg 

atttactgat 

acgctgeegc 

cagtccgcag 

ggaaaacgea 

agactgggcg 

taaggttggg 

gcgcagggga 

tgaegcggga 

etcagccgcg 

gcgttcaaaa 

eactgacgtt 

cagatctcga 

caggttctec 



6087 

6147 

6207 

6267 

6327 

6387 

6447 

6507 

6567 

6627 

6687 

6747 

6807 

6867 

6927 



wo 2004/076617 



5 
10 



15 



20 



.25 



30 



35 



40 



45 



50 



55 



60 



ggccgcttgg 
tgatgccgcc 
^ cctgtccggt 
gacgg&cgtt 
gctattgggc 
agtatcoatc 
attcgaccac 
tgtcgatcag 
caggctcaag 
cttgccgaat 
gggtgtggcg 
tggcg^cgaa 
gcgcatcgcc 
gacggatccc 
cgcactcagt 
tctgaattta 
gttattttat 
ccgtcgtttt 
cagcacatcc 
cccaacagtt 
gccacgttcg 
tttagtgctt 
gggccatcgc 
agtggactct 
ttataaggga 
aaaccagcgt 
tgttgcccgt 
gtgttattaa 
agpcaacagc 
tcagtccggg 
ccgatgctat 



gtggagaggc 
gtgttccggc 
gccctgaatg 
ccttgcgcag 
gaagtgccgg 
atggctgatg 
caagcgaaac 
gatgatctgg 
gcgcgc'atgc 
atcatggtgg 
gaccgctatc 
tgggctgacc 
ttctatcgcc 
ccgatgagct 
ctttcatcta 
aacttgcatc 
caataaatat 
acaacgtcgt 
ccctttcgcc 
gcgcagcctg 
ccggctttcc 
tacggcacct 
cctgatagac 
tgttccaaac 
ttttgccgat 
ggaccgcttg 
ctcactggtg 
gttgtctaag 
tccccgaccg 
acggcgtcag 
tcggaagaac 



101/111 
tattcggcta tgactgggca 
tgtcagcgca ggggcgcccg 
aactgcagga cgaggcagcg 
ctgtgctcga cgttgtcact 
ggcaggatct cctgtcatct 
caatgcggcg gctgcatacg 
atcgcatcga gcgagcacgt 
acgaagagca tcaggggctc 
ccgacggcga ggatctcgtc 
aaaatggccg cttttctgga 
aggacatagc gttggctacc 
gcttcctcgt gctttacggt 
ttcttgacga gttcttctga 
aagctagcta tatcatcaat 
cggcaatgta ccagctgata 
aataaattta tgtttttgct 
ttaaactata tttctttcaa 
gactgggaaa accctggcgt 
agctggcgta atagcgaaga 
aatggcgccc gctcctttcg 
ccgtcaagct ctaaatcggg 
cgaccccaaa aaacttgatt 
ggtttttcgc cctttgacgt 
tggaacaaca ctcaacccta 
ttcggaacca ccatcaaaca 
ctgcaactct ctcagggcca 
aaaagaaaaa ccaccccagt 
cgtcaatttg tttacaccac 
gcagctcggc acaaaatcac 
cgggagagcc gttgtaaggc 
ggcaactaag ctgccgggtt 
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caacagacaa 
gttctttttg 
cggctatcgt 
gaagcgggaa 
caccttgctc 
cttgatccgg 
actcggatgg 
gcgccagccg 
gtgacccatg 
ttcatcgact 
qgtgatattg 
atcgccgctc 
gcgggaccca 
ttatgtatta 
taatcagtta 
tggactateta 
gatgggaatt 
fcacccaactt 
ggcccgcacc 
ctttcttccc 
ggctcccttt 
tgggtgatgg 
tggagtccac 
tctcgggcta 
ggattttcgc 
ggcggtgaag 
acattaaaaa 
aatatatcct 
cactcgatac 
ggcagacttt 
tgaaacacgg 



tcggctgctc 
tcaagaccga 
ggctggccac 
gggactggct 
ctgccgagaa 
ctacctgccc 
aagccggtct 
aactgttcgc 
gcgatgcctg 
gtggccggct 
ctgaagagct 
ccgattcgca 
agctagcttc 
cacataatat 
ttgaaatatt 
tacctgactt 
aattcactgg 
aatcgccttg 
gatcgccctt 
ttcctttctc 
agggttccga 
ttcacgtagt 
gttctttaat 
ttcttttgat 
ctgctggggc 
ggcaatcagc 
cgtccgcaat 
gccaccagcc 
aggcagccca 
gctcatgtta 
atgatctcgc 



69.87 
7047 
7107 
7167 
.7227 
7287- 
7347 
74.07 
7467 . 
. 7S27 
7587 
7647 
7707-: 
7767. 
7827- 
7887, 
7947 
8007- 
8067 
8127 
8187 
8247 
8307 
8367 
8427. 
8487 
8547 
8607 
8667 
8727 
8787 
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ggagggtagc atgttgattg taacgatgac agagcgttgc tgcctgtgat caaatatcat 8847 
ctccctcgca gagatccgaa ttatcagcct tcttattcat ttctcgptta accgtgacag 8907 
5 gctgtcgatc ttgagaacta tgccgacata ataggaaatc gctggataaa gccgctgagg 8967 
■^^f. aagot9agtg gcgctatttc tttagaagtg aacgttgacg atatcaactc ccctatccat 9Q27 
tgctcaccga atggtacagg tcggggaccc gaagttccga ctgtcggcct gatgcatccc 9087 
cggctgatcg accccagatc tggggctgag aaagcccagt aaggaaacaa ctgtaggttc 9147 
gagtcgcgag atcccocgga accaaaggaa gtaggttaaa cccgctccga tcaggccgag 9207- 
15 ccacgccagg ccgagaacat tggttcctgt aggcatcggg attggcggat oaaacactaa 9267. 
agctactgga acgagckgaa gtcctccggc cgcoagttgc caggcggtaa aggtgagcag 9327. 
aggcacggga ggttgccaot tgcgggtcag cacggttccg aacgccatgg aaaccgcccc 9387 
cgccaggpcc gctgcgacgc cgacaggatc tagcgctgcg t|:tggtgtca acaccaacag 9447 
• ■ cgccaqgccc gcagttccgc aaatagcccc caggaccgcc atcaatcgta tcgggctacc 9507- 
25 tagcagagcg gcagagatga acacgaccat cagcggctgc acagcgccta ccgtcgccgc . 9567 
gacccpgccc ggcaggcggt agaccgaaat aaaoaacaag ctccagaata gcgaaatatt 9627 
aagtgcgccg aggatgaaga tgcgcatcca ccagattccc gttggaatct gtcggacgat 9687- • 
. catcacgagc aataaacccg ccggcaacgc ecgcagcagc ataccggcga cccctcggcc 9747 
tcgctgttcg ggctocacga aaacgccgga cagatgcgcc ttgtgagcgt ccttggggcc 9807 
35 gtcctcctgt ttgaagaccg acagcccaat gatotcgccg togatgtagg cgccgaatgc 9867 
cacggcatct cgcaaccgtt cagcgaacgc ctccatgggc tttttctcct cgtgctcgta ' 9927 
^ aacggacccg aacatctctg gagctttctt cagggccgac aatcggatct cgcggaaatc 9987 
ctgcacgtcg gocgctccaa gccgtcgaat ctgagcctta atcacaattg tcaattttaa 10047 
toctctgttt atcggcagtt cgtagagcgc gccgtgcgtc ccgagcgata ctgagcgaag 10107 
45 caagtgcgtc gagcagtgcc cgcttgttcc tgaaatgcca gtaaagcgct ggctgctgaa 10167 
cccccagccg gaactgaccc cacaaggccc tagcgtttgc aatgcaccag gtcatcattg 10227 
acccaggcgt gttccaccag gccgctgcct cgcaactctt cgcaggcttc gccgacctgc 10287 
tcgcgccact tcttcacgcg ggtggaatoo gatcogcaca tgaggcggaa ggtttccagc 10347 
ttgagcgggt aeggctcccg gtgcgagctg aaatagtcga acatccgtcg ggccgtcggc 10407 
55^ gacagcttgc ggtacttctc ccatatgaat ttcgtgtagt ggtcgccagc aaacagcacg 10467 
ac^atttcct cgtcgatcag gacctggcaa cgggacgttt tcttgccacg gtccaggacg 10527 
^ cggaagcggt gcagcagcga caocgattcc aggtgcccaa cgcggtcgga cgtgaagccc 10587 
atcgccgtcg cctgtaggcg cgacaggcat tcctcggcct tcgtgtaata ccggccattg 10647 
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atcgaccagc ccaggtcctg gcaaagctcg tagaacgtga aggtgatcgg ctcgccgata 10707 
ggggtgcgct tcgcgtactc caacacctgc tgccacacca gttcgtcatc gtcggcccgc 10767 
5 ^ agctcgacgc cggtgtaggt gatcttcacg tccttgttga cgtggaaaat gaccttgttt 10827 
tgcagegcct cgcgcgggat tttcttgttg cgcgtggtga acagggcaga gcgggccgtg 10887 
10 *^^Srtttggca tcgctcgcat cgtgtccggc cacggcgcaa tatcgraacaa ggaaagctgc 10947 
atttpcttga tctgctgctt cgtgtgtttc agcaacgcgg cctgcttggc ctcgctgacc 11007 
tgttttgcca ggtcctcgcc ggcggttttt cgcttcttgg tcgtcatagt tcctcgcgtg 11067 
15 tcgatggtca tcgacttcgc caaacctgcc gcctcctgtt cgagacgacg cgaacgctcc 11127 
acggcggccg atggcgcggg cagggcaggg ggagccagtt gcacgctgtc gcgctcgatc 11187 
^ ttggccgtag cttgctggac catcgagccg acggactgga aggtttcgcg gggcgcacgc 11247- 
atgacggtgc ggcttgcgat ggtttcggca tcctcggcgg aaaaccccgc gtcgatcagt 11307 
tcttgdctgt atgccttccg gtcaaacgtc cgattcattc accctccttg cgggattgcc 11367 
25 ccgactcacg ccggggcaat gtgcccttat tcctgatttg acccgcctgg tgccttggtg 11,427 
tccagiataat ccaccttatc ggcaatgaag tcggtcccgt agaccgtctg gccgtccttc 11487 
^ tcgtacttgg tattccgaat cttgccctgc acgaatacca gcgacccctt gcccaaatac . Ii547r 
ttgccgtggg cctcggcctg agagccaaaa cacttgatgc ggaagaagtc ggtgcgctcc 11607 
tgcttgtcgc cggcatcgtt gcgccacatc taggtactaa aacaattcat ccagtaaaat 11667 
35 ataatatttt attttctccc aatcaggctt gatccccagt aagtcaaaaa atagctcgac 11727 
atactgttct tccccgatat cctccctgat cgaccggacg cagaaggcaa tgtcatacca 11787 
cttgtccgcc ctgccgcttc tcccaagatc aataaagcca cttactttgc catctttcac 11847 
aaagatgttg ctgtctccca ggtcgccgtg ggaaaagaca agttcctctt cgggcttttc 11907 
cgtctttaaa aaatcataca gctcgcgcgg atctttaaat ggagtgtctt cttcccagtt 11967 
45 ttcgcaatcc acatcggcca gatcgttatt cagtaagtaa tccaattcgg ctaagcggct 12027 
gtctaagcta ttcgtatagg gacaatccga tatgtcgatg gagtgaaaga gcctgatgca 12087 
ctccgcatac agctcgataa tcttttcagg gctttgttca tcttcatact cttccgagca 12147 
aaggacgcca tcggcctcac tcatgagcag attgctccag ccatcatgcc gttcaaagtg 12207 
caggaccttt ggaacaggca gctttccttc cagccatagc atcatgtcct tttcccgttc 12267 
55 cacatcatag gtggtccctt tataccggct gtccgtcatt tttaaatata ggttttcatt 12327 
ttptcccacc agcttatata ccttagcagg agacattcct tccgtatctt ttacgcagcg 12387 
60 atcagttttt tcaattccgg tgatattctc attttagcca tttattattt 12447 

ccttcctctt ttctacagta tttaaagata ccccaagaag ctaattataa caagacgaac 12507 
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tccaattcac tgttccttgc attctaaaac cttaaatacc agaaaacagc tttttcaaag 12567 

ttgttttcaa agttggcgta taacatagta tcgacggagc cgattttgaa accacaatta 12627 

5 tgggtgatgc tgccaactta ctsratttagt gtatgatggt gtttttgagg tgctccagtg 12687 

gcttcfgtgt ctatcagctg tccctcctgt tcagctactg acggggtggt gcgtaacggc 12747 

aaaagcaccg ccggacatca gcgctatctc tgctctcact gccgtaaaac atggcaactg 12807 

cagttcactt acaccgcttc tcaaccdggt acgcaccaga aaatcattga tatggccatg 12867 

aatggcgttg gatgccgggc aacagcccgc attatgggcg ttggcctcaa cacgatttta 12927 

15 cgtcacttaa aaaactcagg ccgcagtcgg taacctcgcg catacagccg ggcagtgacg 12987 

tcatcgtctg cgcggaaatg gacgaacagt ggggctatgt cggggctaaa tcgcgccagc 13047 

20 ^^^^^^^^^^ ttacgcgtat gacagtctcc ggaagacggt tgttgcgcac gtattcggtg 13107 

aacgcactat ggcgacgctg gggcgtctta tgagcctgct gtcacccttt gacgtggtga 13167 

tatggafcgac ggatggctgg ccgctgtatg aatcccgcct gaagggaaag ctgcacgtaa 13227 

25 tcagcaagcg atatacgcag cgaattgagc ggcataacct gaatctgagg cagcacctgg 13287 

cacggptggg acggaagtcg ctgtcgttct caaaatcggt ggagctgcat gacaaagtca 13347 

tcgggcatta tctgaacata aaacactatc aataagttgg agtcattacc caattatgat 13407 

agaatttaca agctataagg ttattgtcct gggtttcaag cattagtcca tgcaagtttt 13467 

tatgctttgc ccattctata gatatattga taagcgcgct gcctatgcct t^ccccctga 13527 

35 aatccttaca tacggcgata tcttctatat aaaagatata ttatcttatc agtattgtca 13587 

atatattcaa ggcaatctgc ctcctcatcc tcttcatcct cttcgtcttg gtagcttttt 13647 

40 ^^^*^^*^Srgcg cttcatagag taattctgta aaggtccaat tctcgttttc atacctcggt 13707 

ataatcttac ctatcacctc aaatggttcg ctgggtttat cgcacccccg aacacgagca 13767 

cggcacccgc gaccactatg ccaagaatgc ccaaggtaaa aattgccggc cccgccatga 13827 

45 agtccgtgaa tgccccgacg gccgaagtga agggcaggcc gccacccagg ccgccgccct 13887 

cactgcccgg cacctggtcg ctgaatgtcg atgccagcac ctgcggcacg tcaatgcttc 13947 

cgggcgtcgc gctcgggctg atcgcccatc ccgttactgc cccgatcccg gcaatggcaa 14007 

ggactgccag cgctgccatt tttggggtga ggccgttcgc ggccgagggg cgcagcccct 14067 

ggggggatgg. gaggcccgpg ttagcgggcc gggagggttc gagaaggggg ggcacccccc 14127 

55 ttcggcgtgc gcggt<2acgc gcacagggcg cagccctggt taaaaacaag gtttataaat 14187 

attggtttaa aagcaggtta aaaga-caggt tagcggtggc cgaaaaacgg gcggaaaccc 14247 

60 *^*^srcaaatgc tggattttct gcctgtggac agcccctcaa atgtcaatag gtgcgcccct 14307 

catctgtcag cactctgccc ctcaagtgtc aaggatcgcg cccctcatct gtcagtagtc 14367 
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gcgcccctca agtgtcaata ccgcagggca cttatcccca ggcttgtcca catcatctgt 14427 

gggaaactcg cgtaaaatca ggcgttttcg ccgatttgcg aggctggcca gctccacgtc 14487 

6 gccggccgaa atcgagcctg cacctcatct gtcaacgccg cgccgggtga gtcggcccct 14547 

caagtsTtcaa cgtccgcccc tcatctgtca gtgagggcca agttttccgc gaggtatcca 14607 

caacgccggc ggccgcggtg tctcgcacac ggcttcgacg gcgtttctgg cgcgtttgca 14667 

gggcqataga cggccgccag cccagcggcg agggcaacca gcccggtgag cgtcgcaaag 14727 

gcgctcggtc ttgccttgct cgtcggtgat gtacttcacc agctccgcga agtcgctctt 14787 

15 cttgatggag cgcatgggga cgtgcttggc aatcacgcgc accccccggc cgttttagcg 14847 

gctaaaaaag tcatggctct gccctcgggc ggaccacgcc catcatgacc ttgccaagct 14907 

20 ^^^^^^^^^^ ctcttcgatc ttcgccagca gggcgaggat cgtggcatca ccgaaccgcg 14967 

ccgtgcgcgg gtcgtcggtg agccagagtt tcagcaggcc gcccaggcgg cccaggtcgc 15027 

cattgafcgcg ggccagctcg cggacgtgct catagtccac gacgcccgtg attttgtagc 15087 

25 cctggccgac ggccagcagg taggccgaca ggctcatgcc ggccgccgcc gccttttcct 15147 

caatcgctct tcgttcgtct ggaaggcagt acaccttgat aggtgggctg cccttcctgg 15207 

ttggcttggt ttcatcagcc atccgcttgc cctcatctgt tacgccggcg gtagccggcc 15267- 

agcctcgcag agcaggattc ccgttgagca ccgccaggtg cgaataaggg acagtgaaga 15327 

aggaacaccc gctcgcgggt gggcctactt cacctatcct gcccggctga cgccgttgga 15387 

35 tacaccaagg aaagtctaca cgaacccttt ggcaaaatcc tgtatatcgt gcgaaaaagg 15447 

atggatatac cgaaaaaatc gctataatga ccccgaagca gggttatgca gcggaaaagc 15507 

^ gccacgcttc ccgaagggag aaaggcggac aggtatccgg taagcggcag ggtcggaaca 15567 

ggagagcgca cgagggagct tccaggggga aacgcctggt atctttatag tcctgtcggg 15627 

tttcgccacc tctgacttga gcgtcgattt ttgtgatgct cgtcaggggg gcggagccta 15687 

45 tggaaaaacg ccagcaacgc ggccttttta cggttcctgg ccttttgctg gccttttgct 15747 

cacatgttct ttcctgcgtt atcccctgat tctgtggata accgtattac cgcctttgag 15807 

tgagctgata ccgctcgccg cagccgaacg accgagcgca gcgagtcagt gagcgaggaa 15867 

gcggaagagc gccagaaggc cgccagagag gccgagcgcg gccgtgaggc ttggacgcta 15927 

gggcagggca tgaaaaagcc cgtagcgggc tgctacgggc gtctgacgcg gtggaaaggg 15987 

55^ ggaggggatg ttgtctacat ggctctgctg tagtgagtgg gttgcgctcc ggcagcggtc 16047 

ctgatcaatc gtcacccttt ctcggtcctt caacgttcct gacaacgagc ctccttttcg 16107 

^ ccaatccatc gacaatcacc gcgagtccct gctcgaacgc tgcgtccgga ccggcttcgt 16167 

cgaaggcgtc tatcgcggcc cgcaacagcg gcgagagcgg agcctgttca acggtgccgc 16227 
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cgcgctcgcc ggcatcgctg tcgccggcct gctcctcaag cacggcccca acagtgaagt 16287 

agctgattgt catcagcgca ttgacggcgt ccccggccga aaaacccgcc tcgcagagga 16347 

5 agcgaagctg cgcgtcggcc gtjttccatct gcggtgcgcc cggtcgcgtg ccggcatgga 16407 

tgcgctfegcc atcgcggtag gcgagcagcg cctgcctgaa gctgcgggca ttcccgatca 16467 

gaaatgagcg ccagtcgtcg tcggctctcg gcaccgaatg cgtatgattc tccgccagca 16527 

tggcttcggc cagtgcgtcg agcagc^ccc gcttgttcct gaagtgccag taaagcgccg 16587 

gctgctgaac ccccaaccgt tccgccagtt tgcgtgtcgt cagaccgtct acgccgacct 16647 

cgttcaacag gtccagggcg gcacggatca ctgtattcgg ctgcaacttt gtcatgcttg 16707 

acactttatc actgataaac ataatatgtc caccaactta tcagtgataa agaatccgcg 16767 

cgttcaatcg gaccagcgga ggctggtccg gaggccagac gtgaaaccca acatacccct 16827 

gatcgtaatt ctgagcactg tcgcgctcga cgctgtcggc atcggcctga ttatgccggt 16887 

gctgccgggc ctcctgcgcg atctggttca ctcgaacgac gtcaccgccc actatggcat 16947 

25 tctgctggcg ctgtatgcgt tggtgcaatt tgcctgcgca cctgtgctgg gcgcgctgtc 17007 

ggatcgtttc gggcggcggc caatcttgct cgtctcgctg gccggcgcca gate 17061 

30 <210> 35 
<211> 290 
<212> PRT 

<213> Pliaeodactylum tricomutum, Physcomitrella patens, Caenorhalxaitis 



10 



15 



20 



35 



40 



45 



ele^ans 
<400> 35 

Met Glu.Val Val Glu Arg Phe Tyr Gly Glu Leu Asp Gly Lys Val Ser 
^5 10 15 

Gin Gly Val Asn Ala Leu Leu Gly Ser Phe Gly Val Glu Leu Ohr Asb 
20 25 30 

Thr Pro Thr 'Ehr Lys Gly Leu Pro Leu Val Asp Ser Pro Thr Pro lie 
35 40 45 



50 Val Leu Gly Val Ser Val • Tyr Leu Thr lie Val lie Gly~Gly Leu Leu 
50 55 60 

Trp He Lys Ala Arg Asp Leu Lys Pro Arg Ala Ser Glu Pro Phe Leu 
55 65 70 75 80 

Leu <3ln Ala Leu Val Leu Val His Asn Leu Phe Cys Phe Ala Leu Ser 
60 • '° « 

Leu Tyr Met Cys Val Gly He Ala Tyr Gin Ala lie TOir Trp Arg Tyr 
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110 



Ser Leu Trp Gly Asn Ala Tyr Asn Pro Lys His Lys Glu Met Ala lie 
^ . . 115 . .120 125 

Leu Val Tyr Leu Phe Tyr Met Ser Lys Tyr Val Glu Phe Met Asp Thr 
130 135 140 

10 • 

Val lie- Met He" Leu Lys Arg Ser Thr Arg Gin lie Ser Phe Leu His 
145 150 155 160 

15 

Val. Tyr His His Ser Ser He Ser Leu He Trp Trp Ala He Ala His 
165 170 175 

20 His Ala Pro Gly Gly Glu Ala Tyr Trp Ser Ala Ala Leu Asn Ser Gly 
180 .185 190 

I 

Val His Val Leu Met Tyr Ala Tyr Tyr Phe Leu Ala Ala Cys Leu Arg 
25 195 200 205 

Ser Ser Pro Lys Leu Lys Asn Lys Tyr Leu Phe Trp Gly Arg Tyr Leu 
gQ 210 215 220 

Thr Gin Phe Gin Met Phe Gin Phe Met Leu Asn Leu Val Gin Ala Tyr 

230 235 240 

35 

Tyr Asp Met Lys Thr Asn Ala Pro Tyr Pro Gin Trp Leu He Lys He 
245 250 255 

40 Leu Phe Tyr Tyr Met He Ser Leu Leu Phe Leu Phe Gly Asn Phe Tyr 
260 265 270 

Val Gin Lys Tyr He Lys Pro. Ser Asp Gly Lys Gin Lys Gly Ala Lys 
275 280 285 

Thr Glu 
290 

50 

<210> 36 
<211> 282 
<212> PRT 

55 <213> Phaeodactylum tricomutum, Physcomitrella patens, Caenorhabditis 
»^ . elegans 

<46o3^' 36 

60 Met Glu Asn Phe Trp Set He Val Val Phe Phe Leu Leu Ser He Leu 
15 10 15 
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Phe lie Leu Tyr Asn lie Ser Thr Val Cys His Tyr Tyr Met Arg He 
20 25 30 

'Ser Phe Tyr Tyr Phe Thr -He Leu Leu His Gly Met Glu Val Cys Val 
V 35 40 45 

Thr Met He Pro Ser Trp Leu Asn Gly Lys Gly Ala Asp Tyr Val Phe 
50 . 55 • 60 

His Ser Phe Phe. Tyr Trp Cys Lys Trp Thr Gly Val His Thr Thr Val 
^5 70 75 80 

Tyr Gly Tyr Glu Lys Thr Gin Val Glu Gly Pro Ala Val Val He Cys 
85 90 95 

r 

Asn Hig Gin Ser Ser Leu Asp He Leu Ser Met Ala Ser He Trp Pro 
I 100 105 HO 

Lys Asn Cys Val Val Met Met Lys Arg He Leu Ala Tyr Val Pro Phe 
. 115 .120 125 

Phe Asn Leu Gly Ala Tyr Phe Ser Asn Thr He Phe He Asp Arg Tyr 
130 135 140 

Asn Arg Glu Arg Ala Met Ala Ser Val Asp Tyr Cys Ala Ser Glu Mfet 
145 150 155 160 

Lys Asn, Arg Asn Leu Lys Leu Trp Val Phe Pro Glu Gly Thr Arg Asn 
165 170 175 

Arg Glu Gly Gly Phe He Pro Phe Lys Lys Gly Ala Phe Asn He Ala 
180 185 190 

Val Arg Ala Gin He Pro He He Pro. Val Val Phe Ser Asp Tyr Arg 
135 200 205 

Asp Phe Tyr Ser Lys Pro Gly Arg Tyr Phe Lys Asn Asp- Gly Glu Val 
210 215 220 

Val He Arg Val Leu Asp Ala He Pro Thr Lys Gly Leu Thr Leu Asp 
225 230 235 240 

Asp V&l Ser Glu Leu Ser Asp Met Cys Arg Asp Val Met Leu Ala Ala 
245 250 255 



Tyr Lys Glu Val Thr Leu Glu Ala Gin Gin Arg Asn Ala Thr Arg Arg 
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270 



Gly Glu Thr Lys Asp Qly Lys Lys Ser Glu 
5 275 . 280 

<210> 37 
<211> 477 
10 <212> PRT 

tlllaxJ^^°^°''''^'^ tricomutum, Pl^comitrella patens, Caenorhabditis 
<400> 37 

15 

Mfet Gly Lys Gly Gly Asp Ala Arg Ala Ser Lys Gly Ser Thr Ala Ala 
J- 5 10 



15 



20 Arg Lys ^Ile Ser Trp Gin Glu Val Lys Thr His Ala Ser Pro Glu Asp 
. , ^° -25 30 

I 

^ Ala Trp lie He His Ser Asn Lys Val Tyr Asp Val Ser Asn Trp His 



45 



Glu His Pro Gly Gly Ala Val He Phe Thr His Ala Gly Asp Asp Met 
30 ®° 



Thr Asp He Phe Ala Ala Phe His Ala Pro Gly Ser Gin Ser Leu Met 

35 



70 75 30 



Lys Lys Phe Tyr He Gly Glu Leu Leu Pro Glu Thr Thr Gly Lys Glu 
85 90 95 

40 Pro Gin Gin He Ala Phe Glu Lys Gly Tyr Arg Asp Leu Arg Ser Lys 
100 105 110 

Leu He Met Met Gly Met Phe. Lys Ser Asn Lys Trp Phe Tyr Val O^r 
■"■■•■^ 120 125 



Lys cys Leu Ser Asn Met Ala He Tip Ala Ala Ala Cys Ala Leu Val 

50 



130 135 



Phe Tyr Ser Asp Arg Phe Trp Val His Leu Ala Ser Ala Val Mtet Leu 

• ^50 155 j^gQ 

55 

Gly Thr Phe PHe Gin Gin Ser Gly Trp Leu Ala His Asp Phe Leu His 
• I'^O 175 

60 His Gin Val Phe Thr LyS Arg Lys His Gly Asp Leu Gly Gly Leu Phe 
180 185 190 
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Trp Gly Asn Leu Met Qln Gly Tyr Ser Val Gin Trp Trp Lys Asn Lys 
ISS 200 205 



His Asn Gly His His Ala Val Pro Asn .Leu His Cys Ser Ser Ala Val 

215 220 



10 Ala Gin Asp Gly Asp Pro Asp lie 
• 225 



Asp lie Asp Thr Met Pro I,eu Leu Ala Trn 
230 • 235 240 



15 



20 



25 



ser Val Gin Gin Ala Gin Ser Tyr Arg Glu Leu Gin Ala Asp Gly Lys 



250 



255 



Asp Ser Gly Leu Val Lys Phe Met He Arg Asn Gin Ser Tyr Phe Tyr 
260 265 « iir^r 



270 



Phe Pro lie Leu Leu Leu Ala Arg Leu Ser Trp Leu Asn Glu Ser Phe 
I 275 280 



285 



Lys Cys Ala Phe Gly Leu Gly Ala Ala Ser Glu Asn Ala Ala Leu Glu 
^^O 295 



300 



30 Leu Lys Ala Lys Gly Leu Gin Tyr Pro Leu Leu Glu Lys Ala Gly He 



315 



320 



35 



Leu Leu His Tyr Ala Trp Met Leu Thr Val Ser Ser Gly Phe Gly Arg 
325 

Phe Ser, Phe Ala Tyr Thr Ala Phe Tyr Phe Leu Thr Ala Thr Ala 



340 



40 350 

cys Gly Phe Leu Leu Ala He Val Phe Gly Leu Gly His Asn Gly Met 

45 

Ala 

370 375 



Ser 



355 360 365 

Ala Thr Tyr Asn Ala Asp Ala Arg Pro Asp Phe Trp Lys Leu Gin Val 



380 



50 Thr Thr Thr Arg Asn Val Thr Gly Gly His Gly Phe Pro^ Gin Ala Phe 



390 



. 395 



400 



55 



val Asp Trp Phe Cys Gly Gly Leu Gin OVr Gin Val Asp His His Leu 
Ph4 Pro Ser Leu Pro Arg His Asn Leu Ala Lys Tbr His Ala Leu Val 



420 



60 . . 430 

Glu ser Phe Cys Lys Glu Trp Gly val Gin Tyr His Glu Ala Asp Leu 
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■ . 435 

5 ""^^ JIS "^"^ ""^^ ""^^ Val Ala Gly 

Glu Phe val val Asp Phe Val Arg Asp Gly Pro Ala Met 

470 475 



10 



